Де застосовується закон Ципфа?

Відкриття американським лінгвістом Джорджем Зіфом (прізвище якого іноді неправильно читають як «Ципф») закону Ципфа стало початком інфометрії — науки про вимір кількісних характеристик інформації. Ця наука зараз дуже затребувана. На її основі працюють алгоритми пошукових систем на кшталт Google та Yandex, що визначають популярність сайтів та ступінь їх відповідності пошуковому запиту.

Справа в тому, що головне завдання господарів інтернет-сайту полягає в тому, щоб просунути свій сайт у число найперших за відповідністю будь-якій пошуковій фразі. У своїй боротьбі за перші місця в топі деякі з цих хлопців не гидують відвертим шахрайством.

Наприклад, нещодавно був у ході такий прийом: вставляти в текст сайту бажану пошукову фразу скрізь, де можна. І де не можна, теж, маскуючи це неподобство нечитаним шрифтом. Наприклад, писали пошукову фразу білими літерами на білому тлі або вживали дуже дрібний шрифт. Навіщо? Потім, щоб довести пошуковим системам, що їхній сайт краще за інших відповідає даному пошуковому запиту. Чим частіше зустрічається пошуковий запит на їхній сторінці, тим краще. Мабуть, шахраї вважали, що кашу олією не зіпсуєш.

Але сучасні пошукові системи цю хитрість легко виявляють та знешкоджують. І допомагає їм у цьому закон Ципфа.

Природно, що закон Ципфа повинен дотримуватися і для всієї мови, і для деякої її підмножини, невеликого тексту на сайті. Пошуковим системам не складно визначити частоту народження слів на сайті, що перевіряється. При цьому частота слів, що «накручуються» за допомогою несумлінних прийомів, значно перевищуватиме значення частот, які відповідали б закону Ципфа. Таким чином, обман досить легко виявляється і сайти, творці яких хотіли обдурити пошукові системи, цими системами взагалі блокуються.

У мовознавстві, як і будь-якій науці, питань більше, ніж відповідей. Розподіл слів за частотами лише констатує становище, що вже склалося в мові: одні слова зустрічаються частіше, ніж інші. За допомогою закону Ципфа можна визначити деякі кількісні залежності в частоті слів.

Але чи можна відповісти на запитання, чому одні слова стають популярнішими за інші? Прикладів того, як одні слова починають вживатися частіше, ніж інші, і дуже швидко займають високі місця в частотних словниках, ми знаємо безліч.

Один із найбільш запаморочливих злетів зазнало англійського слова yahoo. До 1994 року це слово зустрічалося, мабуть, лише у одній книзі, в «Подорожі Гулівера» Дж. Свіфта. У третій своїй подорожі капітан Гулівер потрапляє до країни, де люди — дикі та нерозумні істоти, яких називають yahoo (у російському перекладі «йеху»).

У 1994 році утворилася компанія Yahoo!, що займалася бізнесом у сфері Інтернету. Паралельно зростанню та комерційним успіхам цієї компанії слово yahoo ставало дедалі популярнішим і, головне, змінило свій зміст. Тепер, вимовляючи це слово, ми тільки в останню чергу згадаємо першоджерело, англійську книгу 17-го століття.

Виявляється, закон Ципфа дозволяє дати хоча б якісно відповідь на питання про те, як відбувається зростання популярності тих чи інших слів. У термінах цього закону мірою популярності слова є його положення у частотному словнику мови. Більш популярне слово знаходиться ближче до початку словника, ніж найпопулярніше.

Сам закон Ципфа відбиває залежність частоти використання слова у мові з його місця у частотному словнику. Популярні слова мови вживаються найчастіше. З математичної точки зору графік цієї залежності є гіперболою з різким підйомом у міру наближення до початку координат і довгим, пологим, майже горизонтальним, хвостом. Більшість слів мови розміщується саме в цьому «хвості». Тут місце слова у частотному словнику, якщо змінює частоту використання цього слова у мові, то зовсім небагато.

Зворотний процес також має місце. Зовсім невелика зміна частоти народження слова в мові може сильно зрушити це слово в частотному словнику до початку, тобто значно підвищити його популярність. Ще одна невелика зміна частоти слова — знову велике підвищення популярності. Причому на початку зростання популярності слова не потребує значних зусиль. Все відбувається хіба що само собою. Слово, про яке багато говорять, без видимих зусиль стає дедалі популярнішим.

Але як тільки положення слова в частотному словнику досягає того місця на гіперболі закону Ципфа, де з наближенням до початку координат починається суттєвий підйом кривої, ситуація змінюється. Тепер невелика зміна частоти слова вже не призводить до значних змін його рангу, тобто положення слова в частотному словнику перестає змінюватися. Отже, зростання популярності слова загальмувалося. Для того, щоб він продовжувався, слід вжити спеціальних заходів для підвищення частоти слова.

Наприклад, якщо слово – назва товару, необхідно витратити кошти на рекламну компанію. Якщо це ім'я кіноактора, цей актор повинен знятися в якомусь блокбастері або зробити якийсь екстравагантний вчинок, щоб про нього знову заговорили. І не просто заговорили, а заговорили набагато голосніше, ніж раніше. Тільки тоді він зможе зрушити вгору у рейтингу собі подібних. Але це переміщення буде досягатися чим далі, тим насилу. І нарешті зупиниться. Подальші витрати на рекламу з метою підвищення популярності імені стануть неефективними.

Понад те, зайва реклама може призвести до результатів, протилежним очікуваним. Так, надто настирлива реклама консервів «Шинка зі спеціями», SPAM («SPiced hAM»), призвела до того, що цю торгову марку 1969 року осміяли в телевізійному скетчі комік-групи «Монті Пайтон». А потім ця торгова марка перетворилася на ім'я загальне, що означає будь-яку настирливу та недоречну рекламу. Це найгірше, що може статися з торговою маркою.

Втім, для акторів і для політиків теж невелика радість, коли їхнє ім'я перетворюється на загальне. Може статися, що, зрештою, ім'я Ю. В. Андропова асоціюватиметься тільки з дешевою горілкою, «андропівкою», випущеною під час його короткого правління Радянським Союзом.

Як бачимо, закон Ципфа, здавалося б, академічний і абстрактний, може допомогти нам зрозуміти деякі дуже конкретні процеси, що відбуваються в навколишньому світі, який дедалі більше стає інформаційним світом.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *