село Клювинці

Четвер, 02.05.2024, 16:29

Вітаю Вас Гість | RSS | Головна | Каталог статей | Реєстрація | Вхід

Головна » Статті » Мои статьи

Статистика діалектів заходу України

Статистика діалектів заходу України

Метою даного дослідження є вивчення сучасного поширення діалектів та рідковживаних слів української мови
за допомогою математичних методів. Основними задачами є:
  • Окреслити регіони вживання певних слів. Провести межі між місцевостями, де по-різному називають одні і ті ж
    поняття чи речі.
  • Використовуючи залежність між роком народження і рівнем вживання, оцінити коли зникне з ужитку те чи інше
    слово в різних місцевостях.
  • Дослідити автокореляції рівня вживання слів за віком респондентів і за географічною відстанню між ними. Тобто
    визначити на яких часових і просторових масштабах існує зв'язок між людьми беручи до уваги їхню лексику.
  • Порівняти лексику окремих регіонів та населених пунктів.

Джерелом первинної інформації є дані опитування щодо вживаності більше 300 вибраних слів. Запропоновано
таку градацію рівнів вживання кожного слова:
5 - активно вживаю тільки такий варіант слова;
4 - вживаю час від часу, або на рівні з іншим аналогом;
3 - вкрай рідко вживаю;
2 - знаю, але ніколи не вживаю;
1 - ніколи не чув цього слова.

Кожен респондент також вказував рік свого народження та населений пункт в якому проживав до закінчення школи.
Станом на 10.02.2013 в опитуванні взяли участь 644 особи. Розподіл кількості респондентів за роками народження
приведено на рисунку нижче.

histogram.png

Переважну більшість анкет отримано із восьми західних областей України, тому на даний момент ми обмежилися
дослідженням лише для цього регіону. Карта нижче показує географію отриманих анкет. Числа в зелених кругах
відповідають кількості респондентів з даного місця. Площі замальовані сірим кольором в Закарпатській та
Чернівецькій області відповідають компактному проживанню угорців, румунів та молдаван. Звідти не отримано
жодних даних, тому ми не враховували ці регіони при побудові карт.

statystyka_rect.png


Існує сильна залежність між роком народження респондента та його лексикою. Отримані дані від
респондентів різного віку, тому необхідним є зведення даних до певного єдиного року народження. Для цього ми
розглянули компактний регіон (виділений прямокутником на карті вище) де широко предствалені респонденти
різного віку. Для простоти вважаємо, що лексика в цьому прямокутнику всюди однакова і залежить лише від року
народження особи. Знайдено, що в середньому рівень вживання слів зменшується на одиницю через кожні 33 роки.
Враховуючи це ми звели рівні вживання слів, всіх респондентів, до 1980 року народження.

Географічний розподіл респондентів є дуже нерівномірним тому для побудови згладжених карт рівнів вживання
ми використали середнє зважене для кожного пікселя. Для вагових коефіцієнтів ми вибрали функцію Гауса
exp(-(di/d0)2). Тут di - відстань в км. від даної точки на карті до i-го респондента, d0 - характерний масштаб на якому,
ми вважаємо, зберігається лексика. В даному випадку, вагові коефіцієнти швидко спадають з відстанню, насправді
значний вплив на колір даного пікселя мають лише найближчі респонденти. Але формально ми враховуємо вплив
всіх респондентів. Отже, для побудови згладженних карт розподілу рівня вживання Bj(x,y) j-го слова в певній
точці (x,y) на карті, ми враховували рівні bi,j від кожного i-го респондента:
eq1.png
Враховуючи густину даних ми поставили d0=10 км. Для великих міст притаманні активні міграційні впливи, тому такі
міста не можуть відображати коректно лексику навколо себе. Тому для респондентів з великих міст, з населенням
більше 100 тис., ми зменшили d0 до 2 км, що відповідає типовим радіусам таких міст. Нижче подані карти розподілів
рівнів вживання для досліджуваних слів.
small_dialect1.jpg
андрути

small_dialect3.jpg
ая

small_dialect4.jpg
баль, бальватися

small_dialect5.jpg
бальон
дивитися карти для решти слів


Існує низка понять та речей, які по різному називають в різних місцевостях. Для виокремлення таких регіонів де панує
певна назва ми використали попередні згладженні карти рівнів вживання. Для кожної точки на карті ми вибрали те слово яке має
там максимальний рівень вживання. Звичайно, це не виключає, що в даному місці паралельно вживають інші
варіанти для позначення даного поняття чи речі. Нижче приведені карти поширення різних варіантів діалектних
відповідників слів ВЕЛОСИПЕД, ЛЕЛЕКА, КАРТОПЛЯ, ДЕРУНИ, СКОВОРОДА, ДЕКО, ГАНЧІРКА ТА ГОРИЩЕ.

small_velosyped.png
велосипед

small_leleka2.png
лелека

small_kartoplia.png
картопля

small_deruny2.png
деруни
small_skovoroda.png
сковорода

small_deka.png
деко для випіканя

small_ganchirka.png
ганчірка

small_goryshche.png
горище

Долучитися до опитування


На основі отриманних даних ми оновили анкету 5 березня 2013 року.

Закликаємо всіх охочих, незалежно від місця проживання та віку, прийняти участь в опитуванні.
Для цього потрібно завантажити файл, поставити навпроти кожного слова бал від 1 до 5 згідно
зазначеної градації вживання, вказати рік народження та населений пункт в якому проживали
до закінчення школи. Далі потрібно вислати заповнену анкету та інформацію
на dialectstat@gmail.com

Для тих хто вже заповнив анкету до 5 березня 2013 року достатньо лише заповнити її другу частину.

В наступному раунді ми плануємо покрити Житомирську та Вінницьку області, а також прилеглі райони
Київської, Черкаської, Кіровоградської та Одеської областей. Тому особливо вітаються заповнені анкети
з цих регіонів.

ОРИГІНАЛ СТАТТІ НА http://dialectstat.wikispaces.com/



Джерело: http://dialectstat.wikispaces.com/
Категорія: Мои статьи | Додав: Ruslan (01.06.2013)
Переглядів: 1567 | Коментарі: 1 | Рейтинг: 0.0/0
Всього коментарів: 0
Ім`я *:
Email *:
Код *:

Форма входу

Категорії розділу

Мои статьи [2]

Пошук

Наше опитування

Що ви змінили б на цьому сайті?
Всього відповідей: 24

Друзі сайту

Статистика


Онлайн всього: 1
Гостей: 1
Користувачів: 0