ROM
написал 7 февраля 2008 года в 21:49 (1516 просмотров)
Ведет себя
как мужчина; открыл 33 темы в форуме, оставил 63 комментария на сайте.
Что-то к вечеру не понимаю — split убивает русские буквы?@inbound -
@inbound — текстовый файл вида «тест test тест»;
foreach (@inbound) {
my @words = split(/\W+/);
print «@words\n»;
};
после split остается » test »;
Что надо сделать чтобы русские буквы оставались?
Последние комментарии
-
OlegL, 17 декабря 2023 года в 15:00 →
Перекличка
21
-
REDkiy, 8 июня 2023 года в 9:09 →
Как «замокать» файл для юниттеста в Python?
2
-
fhunter, 29 ноября 2022 года в 2:09 →
Проблема с NO_PUBKEY: как получить GPG-ключ и добавить его в базу apt?
6
-
Иванн, 9 апреля 2022 года в 8:31 →
Ассоциация РАСПО провела первое учредительное собрание
1
-
Kiri11.ADV1, 7 марта 2021 года в 12:01 →
Логи catalina.out в TomCat 9 в формате JSON
1
DevOps as a Service from Palark
24/7 SRE & DevOps service to cover all your Kubernetes needs.

пофикшено
надо сделать перед split
decode_utf8($_);
появилась другая проблема — съедает все знаки препинания.
как пофиксить?
Ну, мля, сам подумай! Что такое \W? \W — это всё, что не символ слова, т.е. всё, кроме букв и «_». Используй \s лучше.
Спасибо! Помогло =)