Você está na página 1de 3

A magyar teleplsek neveinek elemzse

ksztette:TraBZIS.hu

bevezet
Az albbiakban a TraBZIS.hu telepls tra ( http://www.turabazis.hu/telepules_lista ) alapjn vgzett teleplsnv
elemzst olvashatod. A mai magyarorszgi nll teleplsek neveit vettem grcs al. A nevekbl kigenerltam az
sszes lehetsges n-gramm-ot (szrszletet) minimum 2 karakter hosszsgig. A kapott 118705 tteles listt
sszegeztem a kapott szrszletek alapjn. A 10158 egyedi n-gramm-bl szemmel verssel kivlogattam azokat,
amelyeket rtelmesnek talltam teleplsnv kontextusban. Teht nem felttlenl az sszes rtelmes magyar szt.
Ezen vlogats alapjn 348 olyan nvrszlet addott, amely legalbb 3 teleplsnvben is szerepel. Kiemelten
felhvom figyelmed, hogy az albbi eredmny tiszta statisztikai elemzs alapjn llt el, teht semmifle nyelvi
elemzst nem vgeztem az sszelltsakor. A listt ennek megfelelen kezeld illetve hasznld!
legalbb 3 teleplsnvben elfordul rtelmes nvrszek

A tblzatot a mrete miatt hrom hasbba trdeltem. Az els oszlopban az n-gramm-ot (nvrszletet) tallod, melyet
a msodik oszlopban egy darabszm kvet. Ez mutatja meg, hogy az adott nvrsz hnyszor fordul el a jelenlegi
magyarorszgi nll teleplsek hivatalos nevben. Ha egy teleplsnvben tbbszr is szerepel az adott rszlet, az
tbbszr van beleszmolva az rtkbe. Az utols oszlopban az n-gramm n rtkt vagyis a nvrsz karakter hosszt
lthatod.
ngramm telepDB n
szent 148 5
nagy 107 4
kis 98 3
hz 84 3
hza 76 4
vr 67 3
tisza 58 5
falu 49 4
g 47 2
s 47 2
cs 44 3
s 44 2
zala 43 4
som 42 3
nyr 33 4
magyar 32 6
falva 32 5
balaton 31 7
els 30 4
fels 29 5
hegy 29 4
somogy 27 6
r 27 2
egyhz 26 6
puszta 26 6
mez 26 4
als 25 4
elek 23 4
hely 23 4
t 22 2
egyhza 21 7
telek 21 5
apt 21 4
duna 21 4
saj 21 4
sz 21 3
tr 21 3
eb 21 2
bakony 20 6
fld 20 4
gyrgy 19 6
jsz 19 4
szentgyrgy 17 11
szentmrton 17 11
eger 17 4
ivn 17 4
vc 17 3
g 17 2
szls 16 6
jfalu 16 6
encs 16 4
keresztr 15 9
sziget 15 6
szlls 14 7
mikls 14 6
halom 14 5
gyr 14 4
rba 14 4
szentmikls 13 11
pter 13 5
pilis 13 5
f 13 2
berny 12 6
mihly 12 6
alma 12 4
rk 12 3
bnya 11 5
liget 11 5
udvar 11 5
vmos 11 5
szk 11 4
hernd 10 6
kirly 10 6
csny 10 5
flde 10 5
kapos 10 5
vsr 10 5
bkk 10 4
nyr 10 4
sg 10 3
vg 10 3
b 10 2
szentpter 9 10
gyngy 9 6
kovcs 9 6
lszl 9 6
mtra 9 5
szeme 9 5
vlgy 9 5
cseh 9 4
l 9 2
szentlszl 8 11
mindszent 8 9
gyngys 8 8
hegyes 8 6
arany 8 5
hajd 8 5
jakab 8 5
jnos 8 5
keszi 8 5
kves 8 5
nmet 8 5
ostor 8 5
oszl 8 5
mind 8 4
sas 8 3
szentkirly 7 11
szentivn 7 9
monostor 7 8
hegyht 7 7
andrs 7 6
boldog 7 6
eszter 7 6
ladny 7 6
lrinc 7 6
ngrd 7 6
pspk 7 6
szamos 7 6
sznt 7 6
vrtes 7 6
csehi 7 5
fehr 7 5
fert 7 5
gyula 7 5
mria 7 5
megye 7 5
tpi 7 5
tarna 7 5
jlak 7 5
rok 7 4
buda 7 4
kert 7 4
rc 7 3
aa 7 2
szentandrs 6 11
asszony 6 7
gyarmat 6 7
kpolna 6 7
borsod 6 6
horvt 6 6
hossz 6 6
megyer 6 6
abaj 6 5
dorog 6 5
homok 6 5
koml 6 5
krs 6 5
kutas 6 5
torna 6 5
gagy 6 4
lv 6 4
csa 6 4
pcs 6 4
rend 6 4
sp 6 3
vn 6 3
vz 6 3
zaj 6 3
ae 6 2
szerdahely 5 10
asszonyfa 5 9
erzsbet 5 8
szabolcs 5 8
beseny 5 7
haraszt 5 7
karancs 5 7
kovcsi 5 7
szombat 5 7
varsny 5 7
vsros 5 7
bodrog 5 6
csand 5 6
halsz 5 6
nmeti 5 6
nyrd 5 6
oroszi 5 6
sopron 5 6
szerda 5 6
tamsi 5 6
tarjn 5 6
berek 5 5
bihar 5 5
falud 5 5
flp 5 5
ipoly 5 5
kerka 5 5
komr 5 5
ndas 5 5
olasz 5 5
soml 5 5
szala 5 5
tams 5 5
jvr 5 5
bcs 5 4
dis 5 4
hej 5 4
huta 5 4
imre 5 4
kta 5 4
ppa 5 4
srd 5 4
br 5 3
di 5 3
mr 5 3
szenterzsbet 4 13
szentmihly 4 11
felsszent 4 10
szentjakab 4 10
alsszent 4 9
dunaszent 4 9
keresztes 4 9
szentimre 4 9
veszprm 4 8
fehrt 4 7
fldvr 4 7
harsny 4 7
hartyn 4 7
istvnd 4 7
kisfalu 4 7
komrom 4 7
lengyel 4 7
meggyes 4 7
plske 4 7
szabadi 4 7
szarvas 4 7
szkely 4 7
szemere 4 7
szilvs 4 7
ttfalu 4 7
csenge 4 6
hajms 4 6
hdvg 4 6
kiskun 4 6
komls 4 6
kszeg 4 6
ndasd 4 6
falva 4 6
peterd 4 6
btor 4 5
bks 4 5
csaba 4 5
darc 4 5
rsek 4 5
galga 4 5
kll 4 5
kenz 4 5
kesz 4 5
kisfa 4 5
kozr 4 5
mrok 4 5
meggy 4 5
moson 4 5
hza 4 5
rpce 4 5
simon 4 5
agr 4 4
kos 4 4
baks 4 4
boda 4 4
hz 4 4
fok 4 3
hegyhtszent 3 12
szentkereszt 3 12
bakonyszent 3 11
szentistvn 3 11
dombegyhz 3 10
pilisszent 3 10
bkkszent 3 9
rbaszent 3 9
vsrhely 3 9
vindornya 3 9
egerszeg 3 8
mihlyfa 3 8
palkonya 3 8
baranya 3 7
csszr 3 7
csenger 3 7
jakabfa 3 7
koppny 3 7
zsadny 3 7
bercel 3 6
bodony 3 6
csurg 3 6
lovsz 3 6
mellk 3 6
nmedi 3 6
sikls 3 6
surny 3 6
szalk 3 6
szilas 3 6
trnok 3 6
vasvr 3 6
vindor 3 6
viszl 3 6
zselic 3 6
bajom 3 5
baksa 3 5
bakta 3 5
bdva 3 5
frd 3 5
fzes 3 5
heves 3 5
hvz 3 5
hideg 3 5
ibny 3 5
kozma 3 5
kvg 3 5
leny 3 5
marc 3 5
maros 3 5
mell 3 5
miske 3 5
pald 3 5
plfa 3 5
plyi 3 5
patak 3 5
peres 3 5
rkos 3 5
ricse 3 5
soros 3 5
smeg 3 5
szada 3 5
tolna 3 5
trk 3 5
vrad 3 5
vrs 3 5
akc 3 4
rad 3 4
atd 3 4
bnk 3 4
begy 3 4
csd 3 4
csep 3 4
csp 3 4
kes 3 4
gcs 3 4
kny 3 4
krt 3 4
lta 3 4
mrk 3 4
pli 3 4
ply 3 4
rte 3 4
sima 3 4
szn 3 4
urn 3 4
vg 3 4
tk 3 3

Você também pode gostar