nixp.ru v3.0

26 мая 2017,
пятница,
16:08:33 MSK

DevOps с компанией «Флант»
ROM написал 7 февраля 2008 года в 21:49 (887 просмотров) Ведет себя как мужчина; открыл 33 темы в форуме, оставил 63 комментария на сайте.

Что-то к вечеру не понимаю — split убивает русские буквы?@inbound -

@inbound — текстовый файл вида «тест test тест»;

foreach (@inbound) {

my @words = split(/\W+/);

print «@words\n»;

};

после split остается » test »;

Что надо сделать чтобы русские буквы оставались?

ROM

пофикшено

надо сделать перед split

decode_utf8($_);

ROM

появилась другая проблема — съедает все знаки препинания.

как пофиксить?

myst

Ну, мля, сам подумай! Что такое \W? \W — это всё, что не символ слова, т.е. всё, кроме букв и «_». Используй \s лучше.

ROM

Спасибо! Помогло =)