1
0
mirror of https://github.com/danakt/russian-words.git synced 2025-10-30 23:07:46 +02:00

README.md: drop trailing spaces, add utf-8 conversion instructions

This commit is contained in:
Vadim Bendebury
2021-08-18 22:58:17 -07:00
parent 7dbd3b8d5e
commit 365e81f233

View File

@@ -2,10 +2,17 @@
### `russian.txt`
Текстовый файл со списком русских слов во всех морфологических формах.
Текстовый файл со списком русских слов во всех морфологических формах.
Содержит **1 531 464** записи. Кодировка: **windows-1251**.
### `russian_surnames.txt`
Текстовый файл со списком русских фамилий во всех падежах.
Текстовый файл со списком русских фамилий во всех падежах.
Содержит **877 227** записей. Кодировка: **windows-1251**.
### Преобразование в utf-8
На системах Linux/Unix кодировка windows-1251 может быть преобразована
в utf-8 с помощью утилиты iconv, например:
```
$ iconv -f WINDOWS-1251 -t UTF-8 russian.txt > russian.utf-8
```