I Nobel per la letteratura – parte 7: bonus track 1

di Stefano Sampietro
 
nobelPensavate che l’analisi statistica dei premi Nobel per la letteraura fosse conclusa? Anche io. Ripensando a quanto fatto, tuttavia, mi sono accorto che qualcosa mancava. Nel post introduttivo, infatti, avevo espressamente affermato che leggendo questa rubrica avreste potuto quantificare le vostre chances di vincere il Nobel. Questa promessa non è stata propriamente mantenuta e perciò devo rimediare.
Consideriamo ad esempio il sesso dei vincitori. Una delle osservazioni che abbiamo fatto è stata:
 
“Il 91.43% dei Nobel è maschio”
 
Adottando l’ipotesi, come sottolineato nella parte 6, di considerare direttamente le frequenze come probabilità, e volendo usare termini più rigorosi possibile, la conclusione a cui si può pervenire è:
 
“Dato che un individuo vinca il Nobel, la probabilità che sia maschio è del 91.43%” (frase A)
 
Capite bene che, invece, io avevo promesso di dare risposte a domande del tipo:
 
“Dato che un individuo è maschio, qual è la probabilità che vinca il Nobel?” (frase B)
 
In un certo senso le due affermazioni sono una l’opposto dell’altra, poiché in esse risultano invertite la premessa e la conclusione.
Per fortuna in teoria delle probabilità esiste un risultato che permette di passare dalla quantificazione di bayesuna delle due affermazioni a all’altra: stiamo parlando del cosidetto “teorema di Bayes” (dal nome del reverendo Thomas Bayes, un matematico inglese del diciottesimo secolo).
Rimanendo nell’esempio dei vincitori di sesso maschile, definiamo le seguenti quantità:
 
  1. P(Nobel) = probabilità per chiunque di vincere il Nobel
 
  1. P(maschio) = probabilità che un individuo sia maschio
 
  1. P(maschio | Nobel) = probabilità che un individuo vincitore nel Nobel sia maschio (frase A)
 
  1. P(Nobel | maschio) = probabilità che un individuo maschio vinca il Nobel (frase B)
 
Il teorema di Bayes consente di ottenere l’ultima probabilità conoscendo le prime tre. La formula, semplice ed elegante, è[1]:
 
P(Nobel | maschio) = P(maschio | Nobel) * P(Nobel) / P(maschio)
 
Quanto valgono le tre probabilità a destra dell’equazione? Per due di esse non ci sono grossi problemi:
 
  1. P(maschio | Nobel) = 91.43% (lo sappiamo dalla nostra analisi)
 
  1. P(maschio) = 50.27% (ottenuto dividendo 3’373’654’147, il numero di individui maschi al mondo, per 6’710’926’117, il numero totali degli individui; fonte: US Census Bureau).
 
La probabilità di vincere il Nobel è una quantità più delicata e difficile da stimare. Supponendo di considerare solo il prossimo Nobel e ipotizzando che chiunque su questa terra a partire dai quindici anni d’età possa vincerlo (stiamo larghi!), diciamo che:
 
  1. P(Nobel) = 0.000000021%
 
Che si ottiene dividendo 1 per 4’872’573’128, vale a dire il numero di individui al mondo con almeno quindici anni d’età (fonte: US Census Bureau).
Combinando le informazioni che disponiamo, il teorema di Bayes ci dice che la probabilità che un individuo maschio ottenga il Nobel 2009 è:
 
 P(Nobel | maschio) = 0.9143 * 0.00000000021 / 0.5027 = 0.00000000037
 
come a dire una possibilità su quasi due miliardi e settecento milioni. Prima di disperare, sappiate che:
 
P(Nobel | femmina) = 0.00000000004
 
cioè una possibilità su oltre ventotto miliardi.
Applicando il teorema di Bayes ai profili della lingua e dell’età, ho ottenuto i risultati seguenti.
 
Lingua dei vincitori:
 
P(Nobel | inglese) = 0.00000000023 (cioè 1 su 4’269’266’193)
 
P(Nobel | francese) = 0.00000000171 (1 su 586’437’664)
 
P(Nobel | tedesco) = 0.00000000143 (1 su 698’838’216)
 
P(Nobel | spagnolo) = 0.00000000031 (1 su 3’179’078’576)
 
P(Nobel | italiano) = 0.00000000128 (1 su 781’428’187)
 
P(Nobel | svedese) = 0.00000000787 (1 su 127’061’494)
 
Età dei vincitori:
 
P(Nobel | <50 anni) = 0.00000000002 (1 su 40’890’595’183)
 
P(Nobel | da 51 a 60) = 0.00000000067 (1 su 1’489’170’093)
 
P(Nobel | da 61 a 70) = 0.00000000098 (1 su 1’022’991’512)
 
P(Nobel | da 71 a 80) = 0.00000000173 (1 su 579’638’819)
 
P(Nobel | >80 anni) = 0.00000000040 (1 su 2’475’075’462)
 
Credo che questi risultati comportino due tipi di riflessioni. Innazitutto va notato come essi conducano a conclusioni spesso molto diverse da quelle che apparentemente si ottenevano in precedenza. Ad esempio, nonostante la lingua inglese sia la più frequente fra quelle dei Nobel, non è affatto vero che una persona di lingua inglese abbia più possibilità di vincere. Osservando i numeri sopra riportati, si nota come sia vero il contrario: uno scrittore di lingua inglese ha una possibilità su oltre 4 miliardi, mentre chi scrive in svedese una su 127 milioni. Ciò dipende dalla diversa numerosità di persone che parlano inglese e svedese al mondo e il teorema di Bayes ne tiene giustamente conto.
superLa seconda considerazione riguarda i numeri riportati nel loro valore assoluto e spero non getti nello sconforto chi sta leggendo. Tanto per fare un esempio, secondo i nostri calcoli, un italiano ha più possibilità di vincere il Superenalotto (1 su 622’614’630) che il Nobel (1 su 781’428’187). Tenete però presente che stiamo di certo sottostimando queste probabilità: una stima più accurata per P(Nobel), che ad esempio consideri solo gli scrittori al mondo (se qualcuno conosce il dato, me lo dica!), produrrebbe un valore più alto e, di conseguenza, le probabilità fornite dal teorema di Bayes sarebbero più elevate.
 
Rimane ora un’ultima analisi da compiere. Ognuno di noi non è soltanto maschio o femmina, o soltanto italiano, o soltanto giovane o anziano, ma ovviamente è una combinazione di questi profili. La prossima volta calcoleremo le probabilità congiunte e finalmente tutti noi potremo quantificare le possibilità di vincere il Nobel!
Saluti stocastici!


[1] In realtà l’applicazione corretta del teorema richiede alcune condizioni di coerenza tra le probabilità che qui non ci sono; tuttavia i risultati si possono considerare approssimazioni sufficientemente buone.


Vuoi discutere di questo articolo? Vuoi porre domande all’autore? Visita la sezione Formule e Parole del forum di XII.

 
Annunci
Questa voce è stata pubblicata in formule e parole. Contrassegna il permalink.

Rispondi

Effettua il login con uno di questi metodi per inviare il tuo commento:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...