Вход на сайт

Облако тегов

АШ-YouTube

Словомельница или просто ИИ?

Аватар пользователя Бабай-сан

Далекое будущее... Издательская индустрия на грани развала, писатели пользуются «словомельницами» — автоматами, в которые закачивают идеи своих романов.

Старая добрая НФ, Фриц Лейбер "Серебряные яйцеглавы".

Казалось бы что общего с почти 60 летним произведением в жанре НФ и современностью?

В развитие и дополнения моего предыдущего поста о вычислительной пропаганде хочу привести  пример интерактивного сайта генерирующего вполне осмысленный текст по одному предложению.

Кто пропустил предыдущий пост кратко напомню. 

Ниже перевод блога OpenAI.

-------------------

OpenAI   разработало крупномасштабную модель языка без обучения (то есть для обучения не производилась ручная разметка данных), которая генерирует согласованные абзацы текста, достигает современного уровня производительности по многим тестам моделирования языка и выполняет элементарное понимание чтения, машинный перевод, ответы на вопросы и обобщение - все без  специальной тренировки нейросети.

Модель, названная GPT-2 (преемник GPT), была обучена просто предсказывать следующее слово в 40 ГБ интернет-текста.

GPT-2 - это большая языковая модель на основе преобразователя с 1,5 миллиардами параметров, обученная на наборе данных [1] из 8 миллионов веб-страниц.  

GPT-2 обучается с простой целью: предсказать следующее слово, учитывая все предыдущие слова в некотором тексте.  

Разнообразие набора данных обеспечивает демонстрацию возможности GPT-2  в различных областях.  

GPT-2 - это прямое масштабирование GPT, с более чем 10-кратным увеличением параметров и обучением с более чем 10-кратным увеличением объема данных.

 GPT-2 отображает широкий набор возможностей, в том числе возможность генерировать условные синтетические образцы текста беспрецедентного качества, где мы заполняем модель входными данными и получаем длинное продолжение.

 Кроме того, GPT-2 превосходит другие языковые модели, обученные в определенных областях (например, Википедия, новости или книги), без необходимости использования этих наборов данных для конкретных областей.

 На языковых задачах, таких как ответы на вопросы, понимание прочитанного, обобщение и перевод, GPT-2 начинает изучать эти задачи из необработанного текста, не используя данных обучения для конкретных задач.

 Несмотря на то, что оценки по этим последующим задачам далеки от современных, они предполагают, что задачи могут получить выгоду от  методов обучения без учителя при наличии достаточных (немаркированных) данных и вычислений.

---------------------------

Ниже я приведу примеры запросов к веб интерфейсу.

Запросы только на английском. 

Жирным запрос. 

Потом продолжение текста от ИИ.

Вот про Илона нашего Маска )

While not normally known for his musical talent, Elon Musk is releasing a debut album next week called The New Model U. Now he's opening up about how he came to realize that humans need to be able to reach out and touch the Universe in order to fully understand it.

This is important, Musk explains. The way we see the Universe, we need it to be just as real as we are. But in order to get to that point, we need to understand it all — not just by looking at it, but also how it works in our own Milky Way Galaxy.

Перевод

Хотя обычно Элон Маск не известен своим музыкальным талантом, на следующей неделе он выпускает дебютный альбом под названием The New Model U. Теперь он рассказывает о том, как он осознал, что люди должны быть в состоянии протянуть руку и коснуться Вселенной, чтобы  полностью понимаю это.

 Это важно, объясняет Маск.  То, как мы видим Вселенную, нам нужно, чтобы она была такой же реальной, как и мы.  Но для того, чтобы достичь этого, нам нужно понять все это - не только смотреть на это, но и как это работает в нашей собственной Галактике Млечный Путь.

 

What is the future of the Ukraine as a state?

Image caption Presidential election candidates from the reformist list Yulia Tymoshenko and Mykola Azarov. President Viktor Yanukovych has refused to recognise the new regime

Conspiracy theories also roil in Ukraine. Ukrainian journalist Yuriy Tymoshenko recently told the BBC that she believed the current president was on the CIA's payroll.

There are many in the West, including in the Ukrainian media, who say Ms Tymoshenko has been framed by her country's "robber barons" - some of whom.

Каково будущее Украины как государства?

 Изображение подписи кандидатов в президенты от реформистского списка Юлии Тимошенко и Николая Азарова.  Президент Виктор Янукович отказался признать новый режим

 Теории заговора также процветают в Украине.  Украинская журналистка Юрий Тимошенко недавно сказала Би-би-си, что, по ее мнению, нынешний президент находится в ведомости ЦРУ.

 Многие на Западе, в том числе в украинских СМИ, говорят, что Тимошенко была подставлена ​​"баронами-разбойниками" ее страны, некоторые из которых

What is the destiny of the natural gas pipeline in the Ukraine?

The first part of the pipeline is meant for supplies to countries in the Eastern Region. It will provide about 600,000 tons of gas per year to the country's southern and eastern regions (Slovakia, Ukraine, Belarus, Poland, the Baltic states, Romania, Bulgaria, etc.). It is worth to mention that, for many years, the foreign partners of Ukraine neglected the import of gas from Ukrainian and Russian suppliers. In 2010, the Polish company PGNiG started supplying from the Ukrainian pipeline only about

Какова судьба газопровода на Украине?

 Первая часть газопровода предназначена для поставок в страны Восточного региона.  Он будет поставлять около 600 000 тонн газа в год в южные и восточные регионы страны (Словакия, Украина, Беларусь, Польша, страны Балтии, Румыния, Болгария и т. Д.).  Стоит отметить, что на протяжении многих лет зарубежные партнеры Украины пренебрегали импортом газа от украинских и российских поставщиков.  В 2010 году польская компания PGNiG начала поставлять с украинского трубопровода только около

List of the best advice I ever heard:
1.
 Regularly think about where you will spend your money. This is perhaps the single most important element of any budget. A budget that is just one month old will look hopeless in a year's time. For example, last month I saved $70 of my monthly spending and used it to pay the heating bill. To help generate ideas, come up with a budget for an upcoming month. The next month, the goal is to cut spending by $30 (or whatever number you like) and if you use up all your savings

Перевод

Список лучших советов, которые я когда-либо слышал:
 1. Регулярно думайте о том, куда вы потратите свои деньги.  Это, пожалуй, самый важный элемент любого бюджета.  Бюджет, которому всего один месяц, через год будет выглядеть безнадежным.  Например, в прошлом месяце я сэкономил 70 долларов моих ежемесячных расходов и использовал их для оплаты счетов за отопление.  Для облегсения генерирования идей, придумайте бюджет на предстоящий месяц.  В следующем месяце цель состоит в том, чтобы сократить расходы на 30 долларов (или любое другое число, которое вам нравится), и если вы израсходуете все свои сбережения

Making an omelette is simple!

1.
 Gather all of the ingredients. For this recipe, you can gather the following ingredients:


2 eggs

2 slices of bread

1/2 cup of milk

2/3 cup of sugar

2 teaspoons of salt

cinnamon

To make an omelette, pour the eggs, bread, milk, sugar, salt, cinnamon into a pot and stir together. As soon as the batter forms a mixture, pour the egg mixture into the loaf and fold the bread over the

Перевод

Сделать омлет просто!

 1. Соберите все ингредиенты.  По этому рецепту вы можете собрать следующие ингредиенты:


 2 яйца

 2 ломтика хлеба

 1/2 стакана молока

 2/3 стакана сахара

 2 чайные ложки соли

 корица

 Для приготовления омлета вылейте в кастрюлю яйца, хлеб, молоко, сахар, соль, корицу и перемешайте.  Как только жидкое тесто сформирует смесь, вылейте смесь яйца в буханку и сверните хлеб по..

------------------

Как видите таких невразумительный текстов газетах и интернете сплошь и рядом, а уж политики как этим отличается.

На мой взгляд многие канадские газеты можно уже закрывать за ненадобностью и генерить текст с помощью этого приложения.

 

 

 

Авторство: 
Авторская работа / переводика
Комментарий автора: 

Напоминаю , что  часть этой статьи сгенерировано с помощью современной словомельницы... А может быть и вся статья)))

Фонд поддержки авторов AfterShock

Комментарии

Аватар пользователя Amber_Stallion
Amber_Stallion(4 года 3 месяца)(07:05:27 / 01-12-2019)

Более того, словомельницей возможно сгенерирован и комментарий автора! )))

Аватар пользователя Warman
Warman(1 год 1 неделя)(08:31:26 / 01-12-2019)

Жаль, что на русском нет сервисов с начинкой подобной GPT, обычно российские разработки веселее и остроумнее себя ведут (вероятно, не скованные ошейником толерантности). Феодор, так сразу блог себе завёл, и, в отличии от Бостоновских Динамиков, в космос слетал. Будущее здесь и сейчас.

Про выход - эпично.

 

Аватар пользователя Bruno
Bruno(4 года 5 месяцев)(11:57:49 / 01-12-2019)

Сколковский ИИ (если верить злым языкам) предложил похожий выход из трудной материальной ситуации - валить из этой страны.

Аватар пользователя monk
Аватар пользователя Бабай-сан
Бабай-сан(2 года 2 месяца)(09:11:13 / 01-12-2019)

Комрад спасибо! Это шикарно! Нет, это ШИКАРНО!

Аватар пользователя kot-obormot
kot-obormot(6 лет 6 месяцев)(10:06:00 / 01-12-2019)

Я, как агностик, одобряю этот текст чуть более, чем полностью.

Аватар пользователя Bullet
Bullet(6 лет 7 месяцев)(12:29:49 / 01-12-2019)

Автор явно творчески осмыслил классическое наследие советской литературы. Подобный рассказ гулял ещё по BBS, когда никакого инета и в мыслях не было.

 

    Москва. Зима. Снег. Мальчик играет в футбол. Вдруг - звон разбитого стекла. Выбегает дворник, суровый русский дворник с метлой и гонится за  мальчиком. Мальчик бежит от него и думает:"Зачем, зачем это все? Зачем весь этот имидж уличного мальчишки, весь этот футбол, все эти друзья?  Зачем??? Я уже сделал все уроки, почему я не сижу дома на диване и не читаю книжку моего любимого писателя Эрнеста Хемингуэя?"
    Гавана. Эрнест Хэмингуэй сидит в своем кабинете на загородной вилле, дописывает очередной роман и думает: "Зачем, зачем это все? Как все это надоело, эта Куба, эти пляжи, бананы, сахарный тростник, эта жара, эти кубинцы!!! Почему я не в Париже, не сижу со своим лучшим другом Андре Моруа в обществе двух прелестных куртизанок, попивая утренний аперитив и беседуя о смысле жизни?"
    Париж. Андре Моруа в своей спальной, поглаживая по бедру прелестную куртизанку и попивая свой утренний аперитив, думает:"Зачем, зачем это все? Как надоел этот Париж, эти грубые французы, эти тупые куртизанки, эта Эйфелева башня, с которой тебе плюют на голову! Почему я не в Москве, где холод и снег, не сижу со своим лучшим другом Андреем Платоновым за стаканом русской водки и не беседую с ним о смысле жизни?"
    Москва. Холод. Снег. Андрей Платонов. В ушанке. В валенках. С метлой.
    Гонится за мальчиком и думает:"б.....ь, догоню - убью на...й!!!"

 

Аватар пользователя Alex Arx
Alex Arx(4 года 3 дня)(09:06:50 / 01-12-2019)

 

Первое, что приходит в голову, английский язык более квантовый, чем русский. В английском тексте умещается намного больше смыслов и значений. То есть, английский текст можно перевести на русский многими вариантами. А точность перевода будет во многом зависеть от контекста.

Да, совершенно верно, и с русского на английский можно перевести многими вариантами. Ага, особенно различные русские тексты, близкие по контексту, можно перевести на английский одним вариантом.)

Аватар пользователя Системник
Системник(4 года 11 месяцев)(09:58:59 / 01-12-2019)

Английский, по сравнению с русским, - эмоциональный эрзац, это раз. Второе - изобилующее смысловыми умолчаниями общение = бедность инструмента выражения (информационного, не эмоционального).

Т.е. если задаться целью выразить на английском сложное русское выражение точно, то получится длиннее и утомительнее.

Аватар пользователя monk
monk(7 лет 11 месяцев)(10:09:13 / 01-12-2019)

Английский, по сравнению с русским, - эмоциональный эрзац, это раз.

Английский, на том уровне, на котором Вы его знаете, по сравнению с русским, на том уровне, на котором Вы его знаете.

Т.е. если задаться целью выразить на английском сложное русское выражение точно, то получится длиннее и утомительнее.

Давайте пример, мне действительно интересно. Пока наоборот, массово заимствуют английские слова в русский язык, чтобы не говорить «длиннее и утомительнее» по-русски. Вот попробуйте сказать по-русски без заимствования англицизмов:

Parallelism is one way to implement concurrency, but it's not the only one. Another popular solution is interleaved processing (a.k.a. coroutines): split both tasks up into atomic steps, and switch back and forth between the two.

или

Instantiation patterns are ways to create something in JavaScript. There are four instantiation patterns in JavaScript. They are:

  1. Functional
  2. Functional-shared
  3. Prototypal
  4. Pseudoclassical
Аватар пользователя Бабай-сан
Бабай-сан(2 года 2 месяца)(10:26:24 / 01-12-2019)

Пока наоборот, массово заимствуют английские слова в русский язык, чтобы не говорить «длиннее и утомительнее» по-русски

Это точно, русский фонетически длиннее. Это ощущается.

Это даже в известном историческом анекдоте отмечено. Про длину команд в бою для японцев, американцев и русских. Которые в бою переходят на русский командно матерный, который в полтора раза короче английского.

Аватар пользователя СергиоПетров

без заимствования англицизмов

У меня к вам вопрос: 

1)по какой причине человек предложивший новый термин обязан предлагать его на неродном языке?

2) Вы предлагаете давать собственное название каждому иноязычному термину ?

 

Пока наоборот, массово заимствуют английские слова в русский язык, чтобы не говорить «длиннее и утомительнее» по-русски.

По опыту общения с англоязычными гражданами я вынужден константировать, что ПОЛНАЯ передача  смыслов и отенков интонаций сложного предложения с русского на английский практически нереализуема, ибо превращает фразу в нечитаемый кадавр.

Мне приходилось тратить довольно много времени на формулирование если я хотел передать хотябы 70%. Зачастую мне приходилось полностью отказываться от таких попыток и дискуссия скатывалась к обмену утверждениями.

Аватар пользователя monk
monk(7 лет 11 месяцев)(17:02:49 / 01-12-2019)

1)по какой причине человек предложивший новый термин обязан предлагать его на неродном языке?

В английском это не термины, а обычные слова. Также, как, например, борщ и кефир, которые стали «терминами» в английском языке.

2) Вы предлагаете давать собственное название каждому иноязычному термину ?

Если термин не является именем собственным (как Гугл или Ксерокс), то да. Китайцев не напрягает перевести «instantiate» как 实例 («создать конкретный пример»), а радар как 雷达 («проницающий удар», наверное). Даже Ломоносов использовал слова «кислота» и «раствор» вместо заимствования ацида и солюции.

Аватар пользователя monk
monk(7 лет 11 месяцев)(17:22:51 / 01-12-2019)

2) Вы предлагаете давать собственное название каждому иноязычному термину ?

 Кстати, хороший пример «Алиса в зазеркалье». Переведены Jabberwocker (Бармаглот), Humpty Dumpty (Шалтай-Болтай) и даже slithy переведено как «хливкий».

Аватар пользователя monk
monk(7 лет 11 месяцев)(17:24:49 / 01-12-2019)

Мне приходилось тратить довольно много времени на формулирование если я хотел передать хотябы 70%. Зачастую мне приходилось полностью отказываться от таких попыток и дискуссия скатывалась к обмену утверждениями.

Это просто недостаточное знание целевого языка. Уверен, что они испытывают такие же трудности при попытке перевести нюансы смысла на русский.

Аватар пользователя СергиоПетров

Это просто недостаточное знание целевого языка.

Да да как же иначе то, но вы ведь способны показать всю свою англоязычную мощь?

 

-Чаю будешь?

-Да наверное нет.

Ваш вариант на английском в студию.

Аватар пользователя tokomak
tokomak(8 лет 1 месяц)(13:43:51 / 01-12-2019)

Вот вам пример: переведите на английский точно выражение "ну, океюшки!".

А вообще, любые короткие и сложившиеся в языке конструкции переводятся на иной любой язык всегда длиннее если там нет точно такой же (до уровня тождественности) конструкции, тоже обычно короткой.

Аватар пользователя Alex Arx
Alex Arx(4 года 3 дня)(13:50:32 / 01-12-2019)

 

Пжлста, перевод:

- Вэл, окей.)

Аватар пользователя tokomak
tokomak(8 лет 1 месяц)(14:29:21 / 01-12-2019)

Смысл совершенно иной. Перевод весьма не точный.

Аватар пользователя monk
monk(7 лет 11 месяцев)(16:46:01 / 01-12-2019)

"ну, океюшки!".

"Ah, okay!" или "Okey dokey!". 

А вообще, любые короткие и сложившиеся в языке конструкции переводятся на иной любой язык всегда длиннее если там нет точно такой же (до уровня тождественности) конструкции, тоже обычно короткой.

Любые конструкции вообще всегда переводятся неточно. Даже при заимствовании. Русское «хэндл» не тождественно английскому «handle».

Аватар пользователя Системник
Системник(4 года 11 месяцев)(22:14:04 / 02-12-2019)

Давайте пример, мне действительно интересно.

- Да, нет!

laugh

- Перевыложи эту шнягу!

smiley Ну или переведи все смыслы такого: "Я что, его на помойке нашёл, чтобы в любую дырку совать?"

Или такого: "Воды - по колено, а рыбы - дох@я".

Давай, поупражняйся, раз знаток.


Английский, на том уровне, на котором Вы его знаете, по сравнению с русским, на том уровне, на котором Вы его знаете.

Чушь. Я Марка Твена понимаю.

Аватар пользователя monk
monk(7 лет 11 месяцев)(10:42:17 / 03-12-2019)

Да, нет!

Sure, no!

 - Перевыложи эту шнягу!

Reupload this stuff! или Reshare this stuff!

smiley Ну или пе­ре­ве­ди все смыслы такого: "Я что, его на по­мой­ке нашёл, чтобы в любую дырку совать?"

Здесь все смыслы никак — ссылка на два фразеологизма и игра слов. Самое близкое I know its worth so I'm not to stick it into every hole. или подстрочник I haven't find it in garbage in order to put it into every hole.

Воды - по колено, а рыбы - дох@я

The water is a knee deep and fish is a fucking lot.

P.S. Я не эксперт в английском языке.

Аватар пользователя Системник
Системник(4 года 11 месяцев)(17:08:49 / 03-12-2019)

laugh laugh

Английского ты не знаешь. Это факт. Русский, похоже, тоже на троечку.

 - Перевыложи эту шнягу!

Reupload this stuff! или Reshare this stuff!

Это в особенности доставило.  smiley Ещё одни хабрадрочер?

Вообщем, слив защитан. Технологическое говно твой английский.

Аватар пользователя monk
monk(7 лет 11 месяцев)(11:03:49 / 03-12-2019)

Чушь. Я Марка Твена понимаю.

Надо уметь не понимать, а составлять предложения, понятные англоговорящему не хуже. 

Аватар пользователя Системник
Системник(4 года 11 месяцев)(17:13:53 / 03-12-2019)

Кому и для чего "надо"? Мне моих знаний достаточно, чтобы оценить смысловую и эмоциональную "ёмкость" английского.

Эмоциональный и выразительный эрзац. Аминь.

Аватар пользователя СергиоПетров

Эмоциональный и выразительный эрзац. Аминь.

yes 

Аватар пользователя Alex Arx
Alex Arx(4 года 3 дня)(11:03:26 / 01-12-2019)

 

Да, совершенно верно. И в этом смысле, в совершенно незавидном положении находятся китайцы. На китайском совершенно невозможно выразить точно что-либо.

И в этом, на самом деле, заключён глубокий смысл. Почему русские физики и математики безоговорочно занимают все лидирующие позиции во всех наиболее абстрактных ответвлениях и приложениях теор. физики и теор. математики? Именно поэтому, коллега.

Ещё в утробе матери у русского ребёнка закладывается... эмм... интуитивное понимание устройства мира. И именно этим путём на свет появились Ландау, Королёв, Манин, Менский, Рубаков... ой, да много, много кто ещё. Да, именно владение русским как родным сделало из этих людей тех, кем они... стали, да.

Недаром, именно перевод на русский язык делает из английских монографий по квантовой механике и квантовым компьютерам... эмм... шедевры мировой литературы. Да, друзья мои, перевод на русский превращает эти неказистые природные алмазы в изумительной красоты бриллианты!

Знали бы вы, сколько раз мне звонили восторженные англоязычные авторы и благодарили за сделанный перевод. Да, тут были звонки и от Вернера Гейзенберга, и от Эрвина Шрёдингера, и от Джона Уилера, и от Ричарда Фейнмана, и от Дэвида Бома, и от... нашей талантливой молодёжи, да... от всех этих... эмм... ой, да разве ж их всех упомнишь?

Одна целая, шестьсот восемнадцать тысячных или другими словами 1,618... Знаете ли вы, что это такое? Это золотое сечение. Именно это положение занимает русский язык среди всех языков этой планеты. В нём соединились и фантастическая точность, и квантовая суперпозиция, когда слова и фразы приобретают многозначность и начинают сверкать изумительным блеском Истины.

Да, так на чём мы остановились? Ах да, на китайском языке. Китайский находится на самом конце шкалы, где точность выражения стремится к нулю, а многозначность подскакивает к бесконечности... А где же, в таком случае, находится английский? Недалеко от русского. Да, в эту группу, помимо Инглиша, ещё входят немецкий, французский, испанский и я бы к ним ещё добавил и итальянский.)

Аватар пользователя monk
monk(7 лет 11 месяцев)(17:07:43 / 01-12-2019)

Да, совершенно верно. И в этом смысле, в совершенно незавидном положении находятся китайцы. На китайском совершенно невозможно выразить точно что-либо.

Да ладно. 在平面上的一個直角三角形中,两个直角边边长的平方加起来等于斜邊长的平方。— формулировка теоремы Пифагора. Если в этой формулировке есть неточность, укажите.

Аватар пользователя Alex Arx
Alex Arx(4 года 3 дня)(17:47:46 / 01-12-2019)

 

"Площадь рисового поля на одной стороне жёлтой реки будет равна сумме двух рисовых полей на другой стороне реки, если одна сторона большего поля будет соединять углы двух полей поменьше."

Если это считать точным переводом одной из величайших теорем теор. математики - теоремы Архимеда, то... эмм... я и не знаю, коллега, просто и не знаю, что вам ответить... Ну хорошо. Попробуйте перевести на китайский следующее изречение:

- При интерфернции двух интерферирующих кубитов происходит интерференция их интерферирующих волновых функций.

Вы чувствуете, как каждое слово, каждая буква в этом описании буквально сочится, да, буквально истекает соком... эмм... истины, да. Вот, что значит язык высокого уровня, к коим, вне всякого сомнения, относится и русский.)

Аватар пользователя Бабай-сан
Бабай-сан(2 года 2 месяца)(20:55:57 / 01-12-2019)

Класс! Действительно ёмко и замечательно сказали, истекает соком истины. Есть такое ощущение!

Аватар пользователя monk
monk(7 лет 11 месяцев)(21:58:24 / 01-12-2019)

Площадь рисового поля

Интересно, в каком из тех иероглифов Вам примерещилось рисовое поле? Или Вам рисовые поля при чтении любого китайского текста мерещатся, даже если это документация на космическую станцию Тяньгун-1?

- При интерфернции двух интерферирующих кубитов происходит интерференция их интерферирующих волновых функций.

 在两个干扰量子比特的干扰过程中,发生它们的干扰波函数的干扰

Замечу, что в китайском варианте практически нет англицизмов (разве что "бит" = "比特"), в то время как в русском «интерференция», «кубит» и «функция» явно позаимствованы вместо перевода.

Аватар пользователя Alex Arx
Alex Arx(4 года 3 дня)(12:09:15 / 02-12-2019)

 

Меньше всего на свете мне бы хотелось кого бы то ни было обижать, оскорблять или унижать. Будь то китайцы, американцы или хотя бы даже те же самые украинцы. Это контрпродуктивно, неинтересно, да и просто... по-свински.

Если дело с китайским языком действительно обстоит так, как вы говорите, то... что ж, я буду только рад за наших китайских друзей. Моё знание китайского языка, увы, не позволяет мне быть столь оптимистичным.

Впрочем, я вполне допускаю, коллега, что в некоторых аспектах Чайны ваш уровень знаний может и превосходить мой. Пусть и не намного, но тем не менее...)

Аватар пользователя СергиоПетров

Т.е. если задаться целью выразить на английском сложное русское выражение точно, то получится длиннее и утомительнее.

А в 50% случаев это просто неполучится.

Аватар пользователя Warman
Warman(1 год 1 неделя)(10:40:48 / 01-12-2019)

Сильно приблизительно, со слэнгом и архаикой:

7 000 000 русский (Большая картотека словарного отдела - Русский язык)

1 000 000 английский (из Интернета, если есть более точные данные и ссылка на ресурсы, буду признателен)

Да, массивы, если они даже ошибочны и (или) не полны, отличаются в разы. Соответственно ресурсы для анализа - также в разы. При полном отсутствии эмоциональной окраски. А ведь, ещё береста и лубок.

Реально, скорее всего в составлении текстов используется базовый словарный запас носителя языка, т.е около 5 тыс. слов. Такой запас позволит свободно общаться, читать газеты и журналы, смотреть телепередачи и при этом все понимать.

Аватар пользователя ПРОЛ
ПРОЛ(4 года 6 месяцев)(11:26:02 / 01-12-2019)

Картотека - это примеры употребления слов, это не словарь, где каждая карточка равнозначна уникальному слову. 

Аватар пользователя Warman
Warman(1 год 1 неделя)(11:37:49 / 01-12-2019)

Вот и хотелось бы почитать про картотеку английских слов. Как Мэл Гибсон и Шон Пенн создавали Оксфордский словарь английского я видел.  По данным буржуинской Википедии - "Первое издание словаря содержит около 500 тыс. слов и около 2 млн цитат". 

Всё равно, даже по вариантам употребления, 7:2 - в разы.

Аватар пользователя ПРОЛ
ПРОЛ(4 года 6 месяцев)(11:49:45 / 01-12-2019)

Вы просто не понимаете, о чем говорите. Посмотрите, что представляет из себя эта картотека, посмотрите на примеры карточек http://www.dialog-21.ru/digests/dialog2007/materials/html/31.htm

Хотите сравнивать словари - ну так сравните словари.

Аватар пользователя Warman
Warman(1 год 1 неделя)(12:25:24 / 01-12-2019)

(Растеряно) Как же-ж не представляю?  

Игровой документально-художественный фильм "The Professor and the Madman" (произведённый Ирландией) https://www.kinopoisk.ru/film/996027/

Разве не об аналогичных карточках речь в фильме?

Словарь - это одно, но ИИ нужно "осмысленно" применять слова, т.е. электронами стряпать именно такие карточки у себя в процессоре и выдавать их нагора изумлённой публике. 

Меня опять буржуи обманули? Или, таки, 7:2?

Аватар пользователя ПРОЛ
ПРОЛ(4 года 6 месяцев)(12:32:07 / 01-12-2019)

что 7-2? Откуда вы взяли это соотношение? 

Аватар пользователя Warman
Warman(1 год 1 неделя)(12:46:03 / 01-12-2019)

7 000 000 русский (Большая картотека словарного отдела) (русскийязык.ру)
около 2 млн цитат (Первое издание Оксфордского словаря) (Википедия)
ссылки выше в коментах. 

Если есть более точные данные, пожалуйста, поделитесь.  
С огромным удовольствием расширю свой кругозор и прибавлю знаний, честно.

Аватар пользователя ПРОЛ
ПРОЛ(4 года 6 месяцев)(12:48:31 / 01-12-2019)

Я искренне надеюсь, что вы просто придуриваетесь. Потому что если нет, то все совсем плохо.

Аватар пользователя Alex Arx
Alex Arx(4 года 3 дня)(13:38:51 / 01-12-2019)

 

Коллега, позвольте мне поработать с пациентом. Количество слов в языке напрямую зависит от количества литературы, написанной на нём. Количество жи литературы на английском языке, написанной от сотворения мира и до наших дней, совершенно не поддаётся никакому учёту - настолько огромно это число.

Достаточно будет сказать, что число букв, из которых состоят эти тексты, приближается по своему порядку к числу всех частиц в Наблюдаемой области Вселенной.

Не читайте, не читайте Артура Хейли, друг мой! Начните своё знакомство с великой английской литературой с Чарльза нашего Диккенса, с Билла нашего Фолкнера, ну и ,наконец, с немеркнущего бриллианта английской словесности Хантера нашего Томпсона! Может быть тогда, по прошествии десятилетий беспробудного пьянства... ой, бр-р... то ись, чтения, вы и поймёте... да-с, молодой человек... может быть, вы и поймёте хоть что-нибудь.)

Аватар пользователя Warman
Warman(1 год 1 неделя)(14:31:43 / 01-12-2019)

То есть, цифра - огромна, как Вселенная. Источник - "Уж примите на веру" и "Да все об этом знают, кроме вас".

Спасибо, принято. yes

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Повелитель Ботов

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Комментарий администрации:  
*** Это легальный, годный бот ***
Аватар пользователя megodan
megodan(11 месяцев 4 недели)(11:33:39 / 01-12-2019)

Газеты закрывать нельзя, там помимо текста бумага полезная.

Русский язык конечно сложнее, но сленг интернет сообществ намного проще, на обсуждениях можно будет любую тему как продвинуть, так и забить, как заказчик пожелает.

Аватар пользователя PIPL
PIPL(6 лет 1 месяц)(12:15:28 / 01-12-2019)

Яндекс рефераты: http://referats.yandex.ru/referats/

Реферат по политологии

Тема: «Теоретический доиндустриальный тип политической культуры: предпосылки и развитие»

Информационно-технологическая революция обретает субъект политического процесса. Унитарное государство традиционно определяет субъект власти. Идея правового государства формирует механизм власти. Общеизвестно, что авторитаризм сохраняет авторитаризм.

Согласно классификации М.Вебера, авторитаризм символизирует феномен толпы. Политическое учение Локка, тем более в условиях социально-экономического кризиса, сохраняет бихевиоризм, что было отмечено П.Лазарсфельдом. Общеизвестно, что механизм власти неизбежен.

Социально-экономическое развитие вызывает функциональный постиндустриализм. Борьба демократических и олигархических тенденций, короче говоря, ограничивает функциональный кризис легитимности, впрочем, это несколько расходится с концепцией Истона. Гуманизм вызывает субъект политического процесса, если взять за основу только формально-юридический аспект. Международная политика обретает современный референдум. Как уже подчеркивалось, политическое манипулирование существенно вызывает авторитаризм, об этом прямо сказано в статье 2 Конституции РФ. По сути, социально-экономическое развитие потенциально.

 

Аватар пользователя megodan
megodan(11 месяцев 4 недели)(12:39:59 / 01-12-2019)

Классная игрушка:

Искусство, по данным почвенной съемки, снижает тяжелосуглинистый канон биографии. Комплекс априорной бисексуальности интуитивно понятен.

Лидеры обсуждений

за 4 часаза суткиза неделю

Лидеры просмотров

за неделюза месяцза год

СМИ

Загрузка...