Ентропія одно- та двограм символів в україномовних текстах

Автор(и)

  • Ігор Кульчицький
  • Ігор Ліхнякевич

Ключові слова:

квантитативна лінгвістика, ентропія, статистичні методи, ідіолект, однограми, двограми, статистичний інваріант, атрибуція текстів,

Анотація

У статті досліджено один з аспектів лінгвостатистики для україномовних текстів на семіотичному рівні. Оскільки мова як системний феномен виявляє свої об‟єктивні властивості і в кількісних, і в якісних ознаках, то пояснити функціонування низки мовних категорій без застосування статистичних методів неможливо. У дослідженнях ідіолекту письменника статистичними методами важливою є проблема визначення авторського інваріанта, під яким розуміємо таку кількісну характеристику літературного тексту, яка однозначно характеризує одного автора або невелику групу «близьких» авторів та приймає суттєво відмінні значення для творів різних авторів. Для дослідження інваріантом вибрано ентропію одно- й двограм символів розширеної української абетки. Експерименти проведено на творах Василя Стефаника, Марка Черемшини, Софії Яблонської, текстах журналу «Літературно-науковий вісник» та газети «Сільський господар». Виявилося, що така ентропія інваріантом бути не може, тому потрібно продовжувати вивчати цей аспект. 

Посилання

Батура Т. В. Формальные методы определения авторства текстов / Т. В. Батура // Вестник НГУ. – Серия : «Информационные технологии». – Т. 10, вып. 4. – С. 81–94.

Бодуэн де Куртенэ И. А. Избранные труды по общему языкознанию : в 2. т. / И. А. Бодуэн де Куртенэ. – М. : [б. и.], 1963.

Бук Соломія Лінгвостатистичний опис «Не спитавши броду» Івана Франка / Соломія Бук [Електронний ресурс]. – Режим доступу : http://www.lnu.edu.ua/faculty/ Philol/www/visnyk/55_ 2011/55_2011_Buk.pdf

Бук Соломія Сучасні методи дослідження мови письменника у слов‟янознавстві / Соломія Бук [Електронний ресурс]. – Режим доступу : http://www.lnu.edu.ua/page/n61/010.pdf

Стефаник В. Межа / В. Стефаник // «Літературно-науковий вісник». – Т. 92, кн. 2. – Львів, 1927. – С. 97–98

Стефаник В. Твори / передм. В. Коряка. До друку виготував Ів. Лизанівський. – 3-тє вид. // ДВУ. – 1929. – С. 94–95.

Стефаник В. Твори / Василь Стефаник ; з дереворитами В. Касіяна і М. Бутовича. – Львів : Друк. Вид. спілки «Діло», 1933. – 222 с.

Стефаник В. Шкільник / В. Стефаник // «Рідна школа» – № 1. – Львів, 1932. – С. 2–4.

Гладкий А. В. «Математические методы изучения естественных языков». Математическая логика, теория алгоритмов и теория множеств : сб. работ, посвящ. акад. Петру Сергеевичу Новикову к его семидесятилетию / А. В. Гладкий // Труды МИАН СССР. – 133. – 1973. – С. 95–108.

Кригін М. Ю. Дослідження інформаційно-статистичних властивостей українського тексту / М. Ю. Кригін, В. А. Широков // Математические машины и системы. – ІПММС НАНУ. – 2000. – № 1. – С. 120–127.

Літературно-науковий вісник. – LXXXII : Кн. I–IV. – 1924. – 368 с.

Марков А. А. Пример статистического исследования над текстом «Евгения Онегина», иллюстрирующий связь испытаний в цеп / А. А. Марков // Известия. Имп. акад. наук. – Серия 6. – 1913. – № 3. – С. 153–162.

Методы изучения лексики / под ред. А. Е. Супруна. – Минск : Изд-во БГУ им. В. И. Ленина, 1975. – 232 с.

Пиотровский Р. Г. Информационные измерения язика / Р. Г. Пиотровский.– Л. : [б. и.], 1968. – 116 с.

Пиотровский Р. Г. Математическая лингвистика / Р. Г. Пиотровский, К. Б. Бектаев, А. А. Пиотровская.– М. : [б. и.], 1977.– 383 с.

Сільський господар: орган кураєвого товариства господарського «Сільський господар».– Львів, 1926.– Число 1–12.

Статистичні параметри стилів / за ред. Перебийніс В. С. – К. : Наук. думка, 1967. – 260 с.

Фоменко В. П. Авторский инвариант русских литературных текстов / В. П. Фоменко, Т. Г. Фоменко // Новая хронология Греции: Античность в Средневековье. – М. : МГУ, 1995. – 422 с.

Черемшина Марко. Твори : у 3 т. / Марко Черемшина ; за ред. Є. Пеленського. – Львів : Ізмарагд, 1937.– Т. 1. – 206 с. – Т. 2. – 245 с. – Т. 3. –231 с.

Широков В. А. Інформаційна теорія лексикографічних систем / В. А. Широков. – Киев : Довіра, 1998. – 331 с.

Яблонська С. І. Далекі обрії. – Т. 1 / Софія Іванівна Яблонська. – Львів : [б. в.], 1939. – 183 с. – (Бібліотека «Діла»). 22.

Яблонська С. І. Далекі обрії. – Т. 2 / Софія Іванівна Яблонська. – Львів : [б. в.], 1939. – 169 с. – (Бібліотека «Діла»).

Яблонська С. І. Книга про батька / Софія Іванівна Яблонська. – Едмонтон ; Париж : Слово, 1977. – 237 с. – (Об‟єднання українських письменників у Канаді).

Яблонська С. І. Чар Марока / Софія Іванівна Яблонська. – Львів : Книгарня наук. т-ва ім. Шевченка, 1932. – 83 с.

Gries Th. S. Quantitative methods in linguistics / Th. S. Gries. – CA : University of California, 1973. – 13 p.

##submission.downloads##

Опубліковано

2017-11-30