Analisi statistica della Divina Commedia – parte 16

di Stefano Sampietro
 
L’analisi per lettera finale
Dante1Le parole (types) della Divina Commedia suddivise per lettera finale sono:
finale
parole
parole (%)
cumulate
O
3119
24.31%
24.31%
A
3100
24.16%
48.47%
E
2595
20.22%
68.69%
I
2443
19.04%
87.73%
R
649
5.06%
92.79%
N
499
3.89%
96.68%
L
163
1.27%
97.95%
M
76
0.59%
98.54%
S
57
0.44%
98.99%
T
36
0.28%
99.27%
U
25
0.19%
99.46%
V
17
0.13%
99.59%
D
15
0.12%
99.71%
H
9
0.07%
99.78%
B
8
0.06%
99.84%
C
7
0.05%
99.90%
X
6
0.05%
99.95%
P
3
0.02%
99.97%
Z
2
0.02%
99.98%
G
1
0.01%
99.99%
Q
1
0.01%
100.00%
tot
12831
100%
tabella 1
Non è sorprendente che le vocali rappresentino le lettere finali più comuni: la O, la A, la E e la I sono infatti le finali più frequenti dell’insieme delle parole. Considerando anche la U, si può affermare che l’87,93% delle parole della Divina Commedia si chiudono con una vocale:
gra1
grafico 1
La consonante finale più frequente delle parole è la R (5,06%) e principalmente riguarda verbi all’infinito (“parlar”, “tornar”, ecc.). Anche la seconda consonante (la N, 3,89%) è spesso relativa a verbi coniugati (“avean”, “son”, “eran”), ma prevalentemente identifica preposizioni (“in”, “con”) e avverbi (“non”). La terza consonante è la L e rappresenta l’1,27% delle parole: essenzialmente riguarda articoli, preposizioni articolate, aggettivi dimostrativi e così via.
La ripartizione per lettera finale delle occorrenze (tokens) è invece riassunta dalla prossima tabella:
finale
occorrenze
occorrenze (%)
cumulate
E
24158
23.75%
23.75%
A
20195
19.86%
43.61%
O
17004
16.72%
60.33%
I
16477
16.20%
76.53%
L
6728
6.62%
83.15%
N
5958
5.86%
89.01%
R
5124
5.04%
94.05%
U
1997
1.96%
96.01%
H
1144
1.12%
97.14%
D
1106
1.09%
98.22%
S
643
0.63%
98.86%
M
638
0.63%
99.48%
T
239
0.24%
99.72%
V
151
0.15%
99.87%
C
76
0.07%
99.94%
Z
22
0.02%
99.96%
X
18
0.02%
99.98%
B
9
0.01%
99.99%
G
5
0.00%
99.99%
P
5
0.00%
100.00%
Q
1
0.00%
100.00%
tot
101698
100%
tabella 2
Valgono considerazioni analoghe a quanto visto per le parole. Le vocali rappresentano il caso più frequente:
gra2
grafico 2
Analogamente con quanto fatto con l’analisi delle lettere iniziali, possiamo calcolare per le finali le occorrenze medie (cioè il numero di tokens diviso il numero di types):
finale
occorrenze medie
H
127.11
U
79.88
D
73.73
L
41.28
N
11.94
S
11.28
Z
11.00
C
10.86
E
9.31
V
8.88
M
8.39
R
7.90
I
6.74
T
6.64
A
6.51
O
5.45
G
5.00
X
3.00
P
1.67
B
1.13
Q
1.00
tabella 3
Curiosamente, anche come finale, la lettera H possiede l’occorrenza media più elevata: mediamente le dante-ravenna_largeparole che terminano con H si presentano 127,11 volte. Seguono la lettera U (79,88), la D (73,73) e la L (41,28).
Con i prossimi post, proveremo ad analizzare i profili delle lettere iniziali e finali in modo congiunto.
Saluti stocastici!


Vuoi discutere di questo articolo? Vuoi porre domande all’autore? Visita la sezione Formule e Parole del forum di XII.

Annunci
Questa voce è stata pubblicata in formule e parole. Contrassegna il permalink.