La probabilità del refuso – parte 4 (Il dessert)

di Stefano Sampietro
 

dadiVorrei dedicare questo post a due ipotesi che, più o meno esplicitamente, sono state assunte per l’analisi fino a qui condotta.

Innazitutto, come ricorderete, abbiamo sempre ipotizzato che la quantità p (cioè la probabilità che una singola parola sia un refuso) fosse nota. Nel malaugurato caso in cui una persona non sapesse quale sia la sua personale probabilità di commettere un refuso, è necessario che p venga calcolata (o, per usare un termine più appropriato, “stimata”). Non è escluso che dedicherò a questo problema un post in futuro; per il momento, vi propongo il metodo più semplice in assoluto per stimare p.
Si tratta di un metodo estremamente intuitivo e che si appoggia alla cosidetta “interpretazione frequentista” della probabilità. In pratica, dovete:

  1. Prendere un vostro testo.
  2. Contare il numero totale di parole.
  3. Revisionare o far revisionare il testo.
  4. Contare il numero di refusi.
  5. Calcolare il rapporto tra il numero di refusi e il numero totale di parole.

Il risultato che otterrete sarà la “stima” di p. Naturalmente, si tratta di una semplificazione: è difficile pensare che la p sia la stessa per ogni parola, sarebbe infatti più realistico immaginare che dipenda dalla lunghezza della parola, dalla sua frequenza di utilizzo, dal fatto che sia una parola italiana o straniera, ecc. Un modello di questo tipo sarebbe più complesso ma certamente più interessante e, come dicevo, meriterebbe un approfondimento futuro.

Un’altra ipotesi che abbiamo fatto era che l’unità fondamentale dell’analisi, la particella indivisibile per così dire, era la parola: soltanto la parola, presa nella sua interezza, consentiva di determinare un refuso. Nella discussione sul forum, l’acuto Luigi Acerbi (alias Emiurgo) ha evidenziato come esistano altri tipi di refusi che non sarebbero considerati nella presente impostazione (gli spazi di troppo, quelli mancanti, la punteggiatura sbagliata, e così via), proponendo come soluzione di considerare come unità non più la parola ma il carattere.
In un tale caso, tutto quello che abbiamo scritto fino ad ora rimerrebe formalmente valido: quello che cambierebbe è il significato delle variabili in gioco (la N diventerebbe il numero di caratteri, la p sarebbe la probabilità che un singolo carattere sia sbagliato e x indicherebbe il numero di caratteri sbagliati).

E ora vorrei proporvi il quiz. La soluzione, naturalmente, apparirà nella prossima puntata. Nel frattempo, chi volesse cimentarsi è caldamente invitato a postare la sua soluzione qui.

QUIZ: Considerate un testo di N=50 parole e supponete che p=0.08. 

Domanda n.1: Qual è la probabilità che sia un testo perfetto (senza refusi)?

Domanda n.2: Qual è la probabilità che ci sia un numero di refusi minore di 4?

Domanda n.3: Senza fare conti, quale vi aspettate sia il numero di refusi più probabile?

 
P.S. Ricordatevi di postare i risultati!

Annunci
Questa voce è stata pubblicata in formule e parole. Contrassegna il permalink.

Rispondi

Effettua il login con uno di questi metodi per inviare il tuo commento:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...