Обучение иностранцев русскому языку (часть 3)

Аватар пользователя blkpntr

Возвращаемся к составлению методики обучения иностранцев русскому языку, которая будет реально работать, а не как сейчас. За это время я провёл большую работу.

В прошлой публикации было показано, что самые частые 3000 слов из словаря Шарова при использовании замен покрываются 796 морфемами, не считая окончаний (590 требуют изучения: 100 служебные + 269 ядро + 221 термины; 206 не требуют: 181 международные + 4 звукоподражания + 21 числительные). После оптимизации из этих 590 осталось 539: 98 служебные + 116 действия + 66 характеристики + 259 термины.
Для 5000-словника требуют изучения уже 557 морфем: 98 служебные + 122 действия + 70 характеристики + 267 термины.
+331 не требуют изучения (302 международные (из них 7 можно писать знаками) + 8 звукоподражания + 21 числительные).

Таким образом, изучения 557 русских морфем (кроме окончаний) типичному носителю европейских языков достаточно, чтобы понимать более 90% специально подготовленного русского текста.
По сравнению с 2000-словником для поддержки 3000-словника в ядро понадобилось добавить всего 16 корней, а в термины - 55.
По сравнению с 3000-словником для поддержки 5000-словника в ядро (в действия и характеристики; перечень служебных морфем не расширялся) понадобилось добавить всего 10 корней, а в термины - 8.
Подтвердилось предположение, что динамика нисходящая - добавления морфем между 3000- и 5000-словниками (2000 слов) сравнимы с добавлениями между 2000- и 3000-словниками (1000 слов), даже меньше.
Подтвердилось предположение, что чем более редкие термины, тем больше шансов, что они международные. Международных слов в 5000-словнике на 68% больше, чем в 3000-словнике, что пропорционально (в отличие от русских терминов). Международных терминов уже больше, чем русских (в 3000-словнике было меньше).
По Дмитриеву, для покрытия 95% текста достаточно поддержать 6750 самых частых слов. Предварительный просмотр в районе 6750-го, 7000-го, 8000-го и 10000-го слов показал, что более половины из них при использовании замен описываются уже известными морфемами, а значительная часть оставшихся - международные слова. Таким образом, текущий набор морфем вполне способен покрыть более 95% текста.
Для сравнения, в Basic English 850 слов (там нет числительных, а приставки и суффиксы там не учитываются), а в эсперанто изначально было 900 морфем (даже без антонимов), включая международные. В текущей версии планового русского даже с международными словами морфем меньше, чем в эсперанто. Это включая 31 название растений и животных, которых в большинстве текстов просто не будет.
Школьная программа обучения иностранному языку рассчитана на запоминание 1500-2000 слов, так что изучение планового русского займёт только половину времени, а в остальной части программы можно будет заниматься литературным русским языком, уже фактически умея читать по-русски. При альтернативном подходе (учить слова по какой-либо неадаптированной книге) для того же уровня понимания (95%) нужно вызубрить в 10 раз больше информации. Для типичного ученика это - стена на старте. Наличие же стандартного списка базовых морфем позволит ученику читать любые адаптированные книги и пользоваться специальным толковым словарём.

Как и в прошлый раз, работаем с частотным словарём Шарова. В некоторых случаях в скобках указан номер слова у Шарова.

# отметим те, которые не входят в 2000, но входят в 3000
% отметим те, которые не входят в 3000, но входят в 5000
* отметим те, которых не было в 5000 самых частых
? отметим те, у которых проблемы с образованием или значением
[] отметим те, которые не нужны в плановом русском (имеют замены)
Сохраняем антонимы основных слов (но при обучении они будут вводиться после основных слов).
Не всегда есть полностью синонимичные замены (смотреть=глядеть, кидать=бросать, сверкать=блестеть, прыгать=скакать, шатать=качать). Можно использовать подходящие по контексту или комбинации из 2 слов (максимум 3, если одно-два служебные). Замены не равны толкованиям в толковом словаре (те более точные, но неудобные для вставки в текст). Замены соответствуют переводам в двуязычном словаре.

Действия (122 при 8+26+67 в Basic English):

Характеристики (70 при 94 в Basic English):

Названия растений и животных (6+31):

Части тела (28):

Вещества (34):

Геометрия (30):

Места (12):

Предметы (43):

Роли (18):

Звуки (10):

Отвлечённые понятия (55):

Служебные морфемы (98):

Международные слова (интерлингвизмы) - не требуют изучения. Большинство интерлингвизмов имеют замены. Здесь только те, которые не имеют замен. Не пишем имена собственные, кроме стран и больших регионов (Африка, Сибирь, Кавказ). Не пишем сокращения (КГБ, НКВД, ЦК). Термины заменяем только в бытовом смысле, в специальной литературе они остаются (295+4):

Звукоподражания (8):

Слова, которые можно заменить символами (7+1):

Числительные можно писать цифрами. Зубрить их можно потом (21):

Список замен:

При адаптации литературы списки могут дополнительно вылизываться, но уже видно, что базовый словарь вполне обозрим, а русский язык тоже может работать как конструктор.  Существенных дополнений списков можно не ждать.

Что теперь нужно: адаптировать какие-то книги (какие?) и составить толковый словарь, где все слова будут толковаться из существующих списков.

В начале каждой книги и словаря надо привести все базовые слова с переводами на английский и китайский. Возможно, с иллюстрациями в случае растений, животных, предметов и геометрии. Может быть, если какие-то слова в книге не используются (пока не могу оценить, какой процент слов это будет), их не приводить. Может быть, надо приводить отдельно слова, используемые в каждой главе. В книгах также будут слова, которые не попали в рассмотренные 5000, для них нужно делать сноски. Но в общем и целом каждая такая книга может работать как холодный старт для изучающего. Хотя хотелось бы написать и учебник.

Авторство: 
Авторская работа / переводика
Комментарий автора: 

Кто готов подключиться к работе по распространению русского языка в мире?

Комментарии

Аватар пользователя BuHHuIIyx
BuHHuIIyx(8 лет 5 месяцев)

Простите, но зачем иностранцу слова политбюро, рельс, хоббит, як?

Остальное не открывал. 

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

Они попали в 5000 самых частых слов у Шарова. Такова методика. Просто так выкидывать их я не могу, а заменить не на что. Возможно, як попал по ошибке, но не знаю, с чем Шаров мог его спутать.

Известные ошибки у Шарова:
82 1262.47 тута adv (вм. тут)
447 е.
1066 го
1225 90.16 гот noun
1312 счастие (вм. счастье)
1628 68.74 полок noun
2138 51.17 метода noun
2259 48.23 др noun
2411 44.81 мк noun
2421 44.56 толь noun
2842 37.83 половый adj (вм. половой)
2917 36.54 константин noun, 3712 27.97 славка noun, 3725 27.85 ир noun, 3843 26.99 тоня noun, 3879 26.69 вероника noun, 4163 24.67 кузьмич noun
3138 33.79 шампанский adj (вм. шампанское noun)
3254 32.56 гнома noun
3635 28.65 лет noun
?3657 28.46 пасть noun (вм. verb)
3715 27.97 подряд noun (вм. adv)
4278 23.99 мостовый adj (вм. мостовой)
4405 23.08 подводной adj (вм. подводный)
4962 20.02 взяток noun (вм. взятка)
4454 22.71 подать noun (вм. verb)
4887 20.38 вица noun

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

Судя по непропорциональному использованию военных терминов у Шарова, яком мог быть самолёт Як...

Переставил списки. Самые главные - действия, характеристики и служебные морфемы. Остальное - термины.

Аватар пользователя Чифир
Чифир(12 лет 9 месяцев)

"пасть"

У зверя

Низко пасть

Аватар пользователя Чифир
Чифир(12 лет 9 месяцев)

"полок" в парилке, как без него иностранным специалистам.

Аватар пользователя Чифир
Чифир(12 лет 9 месяцев)

"вица", ну это вообще за гранью... Ладно, я слышал, но иностранцы?

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

Это неправильно обработанное "вице-". "Полок" - это неправильно обработанное "полка". И т. д. Бигдата, вкалывают роботы.

Аватар пользователя Pilm
Pilm(10 лет 9 месяцев)

Вица- what? Чече-вица, поло-вица, краса-вица? 

Не знаю ни одного слова, начинающегося на "вица-".

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

"вице-" значит "заместитель". Список Шарова получен компьютерной обработкой с "угадыванием" начальной формы слова. Тут не угадали.

Аватар пользователя Pilm
Pilm(10 лет 9 месяцев)

Именно полная хрень.

Я начинал изучение русского со 100 глаголов и 1000 существительных. Хватило за глаза для общения вживую.

Прилагательные вообще оказались легкотнЁй.

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

У вас талант - "начать" с зазубривания 1100 слов! А я предлагаю выучить в 2 раза меньше и сразу читать книги на любые темы.

Аватар пользователя Непонял
Непонял(9 лет 3 недели)

Кто готов подключиться к работе по распространению русского языка в мире?
 

а танк дадут?

Аватар пользователя Чифир
Чифир(12 лет 9 месяцев)

Кизлярский, я дам Вам парабеллум (с)

Аватар пользователя Pencroff
Pencroff(2 года 9 месяцев)

Кизлярский, я дам Вам парабеллум (с)

Кислярский. 

Вы, должно быть, коньячком балуетесь?

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

Судя по моему опыту, ничего не дадут. Всё на голом энтузиазме. Но я думаю, хотя бы репостами может заниматься каждый.

Аватар пользователя Harsky
Harsky(12 лет 7 месяцев)

Турпоход будет пешим, в составе группы.

Аватар пользователя Чифир
Чифир(12 лет 9 месяцев)

"як попал по ошибке"

Яком мог быть просто як, парнокопытное млекопитающее из рода настоящих быков семейства полорогих.

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

Проблема в том, что этот як на 3841-м месте, а, например, лось - на 8493-м. Даже баран - и тот 3963-й. А буйвол - 22847-й.

Аватар пользователя Harsky
Harsky(12 лет 7 месяцев)

Як слово хорошее. Анекдот про двух хохлов:

- Микола, ты в зоопарке был, яка выдел?
- Видел
- ну и як як?
- да як як як...

Аватар пользователя Pilm
Pilm(10 лет 9 месяцев)

Мне во сне приснился Лавров. Детали не так важны, но вот то, что он пошутил... Это было невероятно занимательно.

- Мы в штаты направим нового посла.  По фамилии Зайцегон-Шмыга. Посмотрим, как они его по телефону к себе в госдеп вызывать будут...

Аватар пользователя Чифир
Чифир(12 лет 9 месяцев)

Who як, вы слушали "Маяк".

Аватар пользователя Harsky
Harsky(12 лет 7 месяцев)

Не, я даже малость анекдот испортил:

- И як як?
- Як як? Як як як!

Аватар пользователя Pencroff
Pencroff(2 года 9 месяцев)

(stand) ставить, оставить, оставлять, выставка, заставлять, состав, составить, составлять, предоставлять, представитель, представить, представление, представлять, #представляться, поставить, поставлять, *наставление, #доставить, #уставиться, #выставить, %доставлять, %расставаться, %расставить, %предоставить, %ставка, %выставка, %вставить

Мало. Нет совершенно расхожего значения "выносить, терпеть" - "I can't stand the rain against my window".

Кстати, в этом значении у to stand есть забавный синоним to stomach.

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

Это значение обеспечивается словом "выдерживать".

Аватар пользователя Pencroff
Pencroff(2 года 9 месяцев)

Это значение обеспечивается словом "выдерживать".

К сожалению, мне не удалось найти в вышепроцитированном перечне к stand слово "выдерживать".

Я даже в bear заглянул, but no go...

Аватар пользователя blkpntr
blkpntr(9 лет 12 часов)

Эта строчка не на все значения слова "stand", а на образования от корня -став-. Одна строчка - один корень.

Аватар пользователя Pencroff
Pencroff(2 года 9 месяцев)

Эта строчка не на все значения слова "stand", а на образования от корня -став-. Одна строчка - один корень.

Возможно. Нейронная связь "английский для взрослых русских" у ВПС, очевидно, слишком толста, чтобы переключиться на строго обратный подход.

Меня (в своё время) учили т. н. послелогам базовых глаголов to be, to go, to come, to get, to give, to take, to put, to look, etc., которыми можно (и нужно) пользоваться для выражения практически любых действий. 
Действительно, получается красиво: to look after - to take after, to give up, to get on up, to be about, to put off, to put up with - в последней песне на первой стороне London Town Маккартни орёт I've had enough, I can't put up with any more! 

Собственно, примерно так же русский язык - это язык суффиксов.