Языки не знакомые миру

Языки России в Интернете / Habr

языки не знакомые миру

Оказывается, это очень даже внутренне связанный мир. При всём уважении к вам и вашим друзьям/знакомым, я не верю, что. Точнее, говорить так – значит просто быть не знакомым с научным пониманием Потому что язык права – это язык в той или иной степени формальной Гражданское общество – мир частных и корпоративных интересов, в то. 10 самых редких в мире языков, которые стоит, если не выучить, существами, не знакомыми с земными языками и синтаксисом.

Мы только пытаемся его сделать. Но если вдуматься, то всё-таки всё не совсем. У нас, скорее всего, есть два языка, отличия между которыми мы должны найти. Один язык — некоторый малый язык без разницы, якутский или чувашскийа второй — русский. Их мы и должны отделить друг от друга. В таком виде задача уже приобретает выполнимые очертания.

15 самых странных языков мира

То есть нам нужно про каждый, скажем, абзац текста сказать, написан он на русском языке или. Если не на русском, значит, это наш клиент. Определялка не везде и не всегда работала хорошо, но в целом, скорее, удовлетворительно.

Результаты Итак, у нас есть тексты. У нас есть данные о сайтах и сообществах. Что с ними теперь можно сделать? Как минимум, можем выполнить самую базовую программу и отдать собранные тексты лингвистам.

У нас уже есть корпуса бурятскогоудмуртскоготатарскогохакасского языков. Но ещё можно что-то попробовать понять про представленность самого языка в Сети. Много там текстов на этом языке или мало?

А если сравнить с тем, как живёт язык в оффлайне, то его интернет-самочувствие выглядит так же или не так? Сайты Для начала посчитаем, сколько вообще сайтов доменных имён получается на каждый язык. А кем они регистрируются?

Это вообще всё частная или государственная инициатива — выкладывать тексты на малых языках в Интернете?

В принципе, какие-то активисты есть, но большей частью ответственность здесь на организациях. А когда сайты регистрировались? Видно, что процесс шёл по нарастающей, но после года наступил резкий спад.

Наверное, потому что вся активность подобного рода перетекла в набравшие авторитет социальные сети.

языки не знакомые миру

Прежде всего, в vk. Теперь попробуем анализ данных. Вот у нас есть показатели для языка в онлайне: И у нас есть показатели для языка в оффлайне прежде всего, число носителей, но не только, ещё есть кое-какие экономические показатели регионов, в которых большей частью живут носители языка. Есть ли между этими группами показателей корреляция?

А есть ли корреляция внутри группы показателей? Оказывается, что между всеми онлайн-параметрами корреляция Спирмена довольно высокая выше 0. Это значит, что в онлайне язык живёт по своим законам, и что там происходит в Интернете, от числа носителей не зависит.

В общем, это логично, мы знаем, что есть правило одного процента. И важно не то, насколько этот процент большой, а насколько он активен. Есть небольшие языки с активным процентом, а есть языки побольше, среди носителей которых активистов не так много или они не такие уж и активисты. Теперь посмотрим, насколько связаны между собой сайты на разных языках. Составляют ли малые языки замкнутую на себя систему или каждый язык представляет отдельную экосистему? Построим граф, в котором будем учитывать ссылки со страниц, на которых мы находим текст на одном языке, на страницы, на которых есть текст на другом языке.

Примечание про петли в графе У многих языков-вершин есть "петли", это значит, что для этого языка мы видим сайты, которые дают ссылки на сайты на этом же языке. Но петель нет для больших языков, для которых это было бы ожидаемо: Этих петель нет не в реальности, а в наших данных, потому что мы сайты на этих языках не выкачивали и не знаем, кто и на что там даёт ссылки.

Оказывается, это очень даже внутренне связанный мир. Приятно знать, что народы, как писал поэт, распри позабыв, в великую семью соединились, и единение это произошло в пространстве Интернета. Как вообще языки похожи или не похожи друг на друга, если взять всё-всё, что мы про них знаем и по этим параметрам кластеризовать?

Здесь, в общем, очевидные две группы языков: Социальные сети Теперь посмотрим на то, что мы знаем из текстов в vk. Узнать оттуда вообще-то можно много чего, ведь пользователи не только пишут на каком-то языке, но и сообщают про себя разную полезную для лингвистов информацию: Так что здесь данных. Но выполним хотя бы первый подход к снаряду.

В основном, те, кто пишут на малом языке, живут в своём регионе, вероятнее всего — в столице. То есть пишущие на башкирском живут в Уфе, пишущие на удмуртском — в Ижевске.

Это не так для совсем маленьких, почти вымерших языков типа южноюкагирского, их носители живут в Москве. Если это не чукотский. У русского Севера больше связи с Питером, северяне предпочитают северную столицу. Что мы ещё знаем про типичного пользователя-носителя миноритарного языка? Треть всех постов написана на миноритарном языке; Длина текста на миноритарном языке в среднем около пяти слов. А зависит ли в социальной сети число сообществ от числа говорящих на языке вообще?

В целом как-то не. Много есть башкирских сообществ, больше, чем мы бы ожидали от языка с таким числом носителей. Чеченских сообществ, наоборот, меньше ожидаемого.

Но тут надо помнить, что интернетизироваться этот регион стал позже других вследствие известных событий х и начала х. Итак, мы узнали, что малые языки России в Интернете. Они живут на сайтах и в социальных сетях, а с года преимущественно в социальных сетях. Важнее то, сложилось ли вокруг этого языка активное сетевое сообщество, действующее на престижных интернет-площадках Википедия, Вконтакте.

языки не знакомые миру

Ну а получится ли у малых языков выжить в ситуации глобализации, нам предстоит узнать ещё при нашей жизни. Весь код проекта лежит в репозитории. Язык токи пона включает в себя всего корней, поэтому почти все слова в нем имеют несколько значений. Алфавит этого языка состоит из 14 букв: Все официальные слова пишутся строчными буквами, с заглавной буквы начинаются только неофициальные слова, токи поны, такие как имена людей или названия народов, географических мест и религий.

языки не знакомые миру

Написание слов полностью соответствует их произношению, они не изменяются с помощью окончаний, приставок и суффиксов и могут выступать в качестве любой части речи. Предложения имеют жесткую структуру. Токи пона является прежде всего языком для общения в Сети и служит примером интернет-культуры. Считается, что в настоящее время этим языком пользуются несколько сотен человек.

Части тела человека на языке Toki pona Пример jan wile e ali la jan weka e ali. Всё желать — всё потерять. Рыбак рыбака видит издалека. С кем поведешься, от того и наберешься. Плохое окружение портит хорошие манеры. Лучше всех работает тот, кто знает свое. Краткость — сестра таланта. Эсперанто Эсперанто — самый известный и распространенный из искусственно созданных языков.

КАКОЙ САМЫЙ СЛОЖНЫЙ ЯЗЫК В МИРЕ?

Этот язык был сконструирован варшавским врачом и лингвистом Лазарем Людвигом Марковичем Заменгофом в году. Он назвал свое творение Internacia международный.

Основу эсперанто составляют интернациональные слова, заимствованные из латыни и греческого языка, и 16 грамматических правил, не имеющих исключений. В данном языке отсутствует грамматический род, в нем всего два падежа — именительный и винительный, а значения остальных передаются при помощи предлогов.

Алфавит построен на основе латинского, а все части речи имеют фиксированные окончания: Все это делает эсперанто настолько простым языком, что неподготовленный человек может научиться достаточно свободно говорить на нем за несколько месяцев регулярных занятий.

Для того, чтобы выучить на том же уровне любой из естественных языков, требуется хотя бы несколько лет. В настоящее время эсперанто активно используют, по разным оценкам, от нескольких десятков тысяч до нескольких миллионов человек.

Обычно это дети от браков, где родители принадлежат к разным народам и используют эсперанто для внутрисемейного общения. На распространенность эсперанто указывает, среди прочего, тот факт, что объем Википедии на этом языке превышает тысяч статей.

языки не знакомые миру

А это больше, чем разделы на таких естественных языках как словацкий или корейский. У эсперанто есть языки-потомки, в которых отсутствует ряд существующих в эсперанто недостатков.

15 самых странных языков мира

Наиболее известные среди этих языков — эсперантидо и новиаль. Впрочем, ни один из них не получит такого распространения, как эсперанто. Пример Вот как выглядит на эсперанто начало произведения М. Первый из них, одетый в летнюю серенькую пару, был маленького роста, упитан, лыс, свою приличную шляпу пирожком нес в руке, а на хорошо выбритом лице его помещались сверхъестественных размеров очки в черной роговой оправе.

Волапюк Алфавит волапюка построен на основе латинского и состоит из 27 знаков. Данный язык отличается очень простой фонетикой, что должно было облегчить его изучение и произношение детям и народам, в языке которых нет сложных сочетаний согласных.

Корни большинства слов в волапюке заимствованы из английского и французского языка, но видоизменены для того, чтобы соответствовать правилам нового языка. В волапюке 4 падежа: К недостаткам этого языка относят сложную систему образования глаголов и различных глагольных форм.

В году был создан первый учебник на немецком языке, а через два года на волапюке уже издавались газеты. К году во всём мире издавалось 25 журналов на волапюке и было написано учебников на 25 языках, а количество клубов любителей этого языка почти достигло трех сотен. Однако постепенно интерес к данному языку начал угасать, причем особенно сильно на этот процесс повлияли внутренние конфликты в Академии волапюка и появление нового, более простого и изящного планового языка — эсперанто. Считается, что в настоящее время в мире насчитывается всего около людей, владеющих волапюком.

Тем не менее, раздел Википедии на этом языке по количеству статей превосходит раздел на эсперанто.

языки не знакомые миру

Причина этого в том, что почти все статьи на волапюке созданы ботами.