wd wp Пошук:

Закон Ціпфа

Зако́н Цíпфа (Зíпфа) — эмпірычная заканамернасць размеркавання частаты сустракаемасцi слоў натуральнай мовы ў вялікім тэксце. Закон Цiпфа быў вынайдзены Джорджам Цiпфам, якi даказаў, што частата выкарыстання n-га найбольш часта выкарыстоўваемага слова ў натуральных мовах прыблізна зваротна прапарцыйная яго парадкаваму нумару n (рангу).

Сёння пад законам Цiпфа часцей за ўсё маюць на ўвазе заканамернасць ранг-частата, вядомую таксама як «універсальнае гіпербалічнае рангавае размеркаванне». Калі скласці спіс з усіх слоў тэксту і адсартаваць яго па парадку змяншэння частаты F выкарыстоўвання слоў, то для кожнага слова здабытак яго парадкавага нумара R у гэтым спісе на частату выкарыстання будзе роўны пастаяннай велічыні C.

C

F ∗ R

{\displaystyle C=F*R}

\{\displaystyle C=F*R\} — у клаciчным выглядзе i

C

F ∗

R

Y

{\displaystyle C=F*R^{Y}}

\{\displaystyle C=F*R^\{Y\}\} — з папраўкай Мандельброта, дзе F — частата выкарыстання слова, R — парадкавы нумар; С — пастаянная велічыня, а Y — блізкая да адзінкі пераменная велічыня, якая змяняецца ў залежнасці ад параметраў тэксту.

Спасылкі

Тэмы гэтай старонкі (3):
Катэгорыя·Корпусная лінгвістыка
Катэгорыя·Тэкст
Катэгорыя·Рэгіянальная эканоміка