L’anatomia dell’equazione di Dirac

Paul A. M. Dirac, 1902-1984

In un precedente articolo abbiamo parlato della genesi dell’equazione di Dirac. Ora però mettiamo le mani nella marmellata ed eseguiamo una vera e propria dissezione dell’equazione, in ogni suo elemento chiave.

Cosa contiene

Partiamo dal capire cosa c’è dentro. Abbiamo di fronte a noi cinque simboli diversi, ciascuno con un ruolo ben preciso. Procediamo da sinistra verso destra

  • La “i”, altrimenti nota come unità immaginaria.
    Cosa è?: È un numero, proprio come anche 2 è un numero, o 13.4. L’unica differenza è che “i” ha delle proprietà speciali, infatti è l’unico numero che moltiplicato algebricamente per se stesso è capace di dare come risultato un numero negativo, cioè i2 = −1.
    Perché è presente nell’equazione?: la meccanica quantistica prevede l’utilizzo delle unità immaginarie al fine di semplificare la scrittura delle equazioni più importanti. I fisici sono pigri e preferiscono usare la notazione più comoda e diretta possibile. I “numeri complessi“ garantiscono comodità logistica. Nulla di più, nulla di meno.
  • “La matrice γμ “, nota come matrice di Dirac.
    Cosa è?: È una matrice, cioè un oggetto matematico che ha il compito di trasformare altri oggetti formati da più componenti. La trasformazione ha l’effetto di mischiare queste componenti secondo una particolare ricetta contenuta nella struttura matematica della matrice. In questo caso l’oggetto da trasformare è la funzione d’onda ψ, che nella teoria di Dirac è formata da 4 componenti.
    Perché è presente nell’equazione?: come discusso nel precedente articolo sulla genesi, le γμ sono presenti al fine di garantire la covarianza dell’equazione sotto le trasformazioni relativistiche di Einstein. (Per saperne di più sul concetto di covarianza clicca qui).
  • “La derivata parziale ∂μ” , scritta in un formato criptico e riassuntivo.
    Cosa è?: è un operatore, cioè trasforma gli oggetti proprio come una matrice, ma in aggiunta ha anche il compito di calcolare la variazione dell’oggetto in una specifica direzione dello spazio-tempo. Le direzioni dello spaziotempo sono specificate dall’indice μ=0,1,2,3 in cui μ=0 è la direzione temporale, e μ=1,2,3 sono le tre direzioni cartesiane x,y,z a cui siamo abituati.
    Perché è presente nell’equazione?: In fisica studiamo i sistemi chiedendoci come variano sotto certi stimoli. Le variazioni sono calcolate con le derivate. Le equazioni chiave della fisica sono chiamate “equazioni differenziali” perché contengono le derivate delle soluzioni che vogliamo trovare, cioè hanno il compito di descrivere l’evoluzione di un sistema chiedendoci: “sai trovare quella funzione soluzione ψ che quando varia in un certo modo descritto dall’equazione differenziale ci dà questo risultato?”. La risposta a questa domanda, matematicamente, fornisce la soluzione che permette di fare previsioni teoriche da verificare sperimentalmente.
  • “La massa m”.
    Cosa è?: è la massa della particella descritta dalla soluzione ψ.
    Perché è presente nell’equazione?: come spiegato nella genesi dell’equazione, l’equazione di Dirac è stata ricavata modellando l’equazione di Schrödinger e adattandola al caso relativistico. In tal caso l’energia di una particella ferma è proporzionale alla sua massa, come evidenziato da E=mc2: questa massa deve quindi comparire esplicitamente nell’equazione differenziale relativistica (perché l’equazione di Schrödinger coinvolge proprio l’energia della particella).
  • “La funzione d’onda ψ“, altrimenti nota come spinore di Dirac.
    Cosa è?: dal punto di vista quantistico rappresenta quella quantità matematica il cui modulo al quadrato rappresenta la densità di probabilità di trovare la particella in un certo punto dello spazio. Dal punto di vista della teoria dei campi rappresenta il campo della particella di massa m, distribuito nello spaziotempo. Le eccitazioni di questo campo vengono interpretate come la particella stessa.
    Perché è presente nell’equazione?: per trovare l’espressione matematica del campo ψ, occorre capire come si comporta quando si calcola una sua variazione. Questo è il metodo delle equazioni differenziali, e l’equazione di Dirac è un’equazione differenziale. L’equazione ci chiede di trovare la più generica ψ che rispetta una certa proprietà. Questa proprietà è evidenziata da un altro modo di scrivere la stessa equazione (portando cioè il termine di massa a secondo membro):
Un altro modo di scrivere l’equazione di Dirac.

L’equazione ci sta parlando, ci chiede di risolvere un determinato problema:

Sai trovare quella funzione ψ tale che, una volta trasformata tramite gli operatori “γμμ” e moltiplicata per il numero “i”, produce come risultato la moltiplicazione di se stessa per una costante “m”?

La risposta a questa domanda fornisce la soluzione per il campo di una particella massiva, libera da forze.

Come si interpreta

Per capire il potere concettuale di questo modo di porre i problemi, cioè quello di ricavare delle informazioni su un certo oggetto ψ studiando prima come si comporta sotto trasformazioni generate da degli operatori, è molto utile sfruttare un’analogia con il concetto di vettori.
Un vettore 2D può essere rappresentato sul piano cartesiano (x,y) come una freccia uscente dall’origine:

La rappresentazione cartesiana del vettore (1,1). Le sue componenti sono v1=1 sull’asse x, e v2=1 sull’asse y.

Ad esempio per costruire un vettore di componenti (1,1), cioè v1=1 sull’asse x, e v2=1 sull’asse y, parto dall’origine e mi sposto di 1 sull’asse x, poi mi sposto di 1 sull’asse y. Il punto in cui arrivo è la testa del vettore. Collegando la testa con la coda (cioè l’origine) ottengo una linea diagonale che chiamo “vettore”.
Un vettore può essere trasformato da una matrice usando la seguente ricetta di composizione:

Il risultato della trasformazione di un vettore è un nuovo vettore le cui componenti possono essere ottenute dalla ricetta contenuta nella matrice.

Il vettore trasformato ha le sue componenti che nascono mischiando le componenti del vettore di partenza, secondo una particolare ricetta descritta dalla matrice-operatore.
Anche il non fare niente è una trasformazione: prende il nome di matrice identità, la sua azione mi fa ottenere di nuovo il vettore di partenza. Puoi verificare anche tu con la ricetta data sopra che il seguente calcolo lascia invariato il vettore di partenza:

La matrice identità lascia il vettore invariato.

Infatti in questo caso l’operatore è tale che a1=1, a2=0, a3=0, a4=1, e sostituendo nella ricetta di sopra otteniamo proprio che il vettore rimane invariato.
Una trasformazione meno banale può invece essere una riflessione, descritta da:

La riflessione del vettore produce un vettore con la componente y invertita di segno.

Puoi verificare il risultato pure tu usando la solita ricetta. Graficamente abbiamo invertito la componente verticale del vettore, come si vede sul piano cartesiano:

La riflessione di un vettore produce un vettore diverso, speculare rispetto al primo.

L’equazione di Dirac si presenta, come accennato, nella seguente veste:

La quale ricalca fortemente il modo in cui trasformiamo i vettori. In questo caso la ricetta prescritta dall’equazione è molto specifica: la trasformazione di ψ è tale da restituire come risultato la ψ stessa, moltiplicata per la massa m. Dal punto di vista matematico, questa richiesta può permetterci di trovare la ψ in maniera non ambigua.


NB: non a caso ψ soddisfa un’equazione con una struttura simile alle equazioni vettoriali con le matrici. Infatti ψ sono oggetti parenti dei vettori, chiamati spinori di Dirac. La differenza fondamentale con i vettori è legata al modo in cui trasformano sotto trasformazioni di Lorentz, come accennato in questo articolo.

Come si usa

Per dare un assaggio di come si affronti una situazione in cui si deve risolvere l’equazione di Dirac, scegliamo la situazione più semplice possibile: il caso di una particella libera e ferma rispetto a noi.
Prima permettimi di trasformare l’operatore “γμμ in una sua forma più agevole matematicamente:

In meccanica quantistica l’operatore μ può essere espresso in termini della quantità di moto “p” della particella. Per ora prendi questa affermazione come un “ipse dixit”, non è questo il luogo e il momento per giustificarla. L’equazione di Dirac può quindi essere scritta come

L’equazione di Dirac espressa con la quantità di moto.

In cui esplicitiamo una volta per tutte il fatto che con γμpμ intendiamo una somma che per pigrizia non avevamo voglia di esplicitare prima

La somma ha il segno negativo nelle componenti spaziali per via della struttura dello spaziotempo della relatività ristretta di Einstein.

Le quantità γ123 sono tutte matrici di Dirac che non ci interessano perché noi supponiamo che la particella sia ferma rispetto a noi, quindi le componenti spaziali della quantità di moto sono nulle, cioè px=py=pz=0. La “quantità di moto” di indice p0 è invece solo un modo lezioso di chiamare l’energia totale della particella. Nel caso di particella a riposo l’energia è, com’è arcinoto:

m è la massa della particella, c è la velocità della luce.

Da ora in poi porremo c=1 per pigrizia, dato che questa scelta non cambia di sicuro la fisica del problema. L’equazione di Dirac si traduce in

che ha la stessa identica forma delle equazioni con i vettori studiate sopra. Le quantità scritte hanno le seguenti espressioni esplicite

Lasciando agire γ0 su u(p) otteniamo

L’effetto di γ0 su u(p) è quello di capovolgere le sue componenti. Puoi verificare usando la regola di composizione matrice-vettore.

Eguagliando questo risultato con u(p) stesso, come ci dice di fare l’equazione di Dirac, scopriamo di dover risolvere il seguente sistema a due incognite

il quale ha la soluzione ovvia u1=u2: una particella di Dirac ferma rispetto a noi ha uguali componenti spinoriali. La soluzione può essere scritta sostituendo u1=u2 e invocando la struttura di onda piana (che è ovviamente soluzione, ed è evidenziata dall’esponenziale contenente quantità di moto e coordinate spaziali):

Da questa espressione si evince che in realtà lo spinore che abbiamo trovato è composto da altre due componenti aggiuntive. In realtà ti ho ingannato tutto il tempo per salvare la semplicità concettuale: uno spinore di Dirac è un oggetto a quattro dimensioni, non due. Tuttavia può essere visto come un oggetto di due componenti, le quali sono a loro volta composte da altre due componenti, per un totale di quattro. La matematica è molto simile e si presta bene a questo inganno.


Una volta ottenuta la soluzione per la particella ferma si può effettuare una trasformazione di Lorentz per osservarla in movimento e derivare così la soluzione più generica per una particella libera.

“Però io credevo che il mondo della Fisica fosse costellato da interazioni tra particelle. Che utilità hanno le soluzioni di particella “libera" senza interazioni?"

Giusta osservazione. Le soluzioni di particella libera in realtà sono ottime approssimazioni per trattare processi in cui le particelle arrivano a collidere e poi si allontanano: nei due stati iniziale e finale possiamo considerare le particelle come libere, ed usiamo la soluzione molto semplice dell’equazione di Dirac per descriverle. L’interazione viene trattata in maniera perturbativa considerando piccoli contributi delle interazioni, basandoci sempre sulla soluzione libera.


PS. ho scritto un libro di testo che rappresenta proprio ciò che avrei desiderato leggere all’inizio dei miei studi di Fisica teorica, per renderla accessibile agli amatori e insegnare le tecniche matematiche necessarie a una sua comprensione universitaria. Si chiama “L’apprendista teorico” , dai un’occhiata per vedere di cosa si tratta. Il libro è acquistabile su Amazon.

Questa immagine ha l'attributo alt vuoto; il nome del file è cover_view_2.png
Questa immagine ha l'attributo alt vuoto; il nome del file è amazon_btn.jpg

La genesi dell’equazione di Dirac

L’equazione d’onda relativistica dell’elettrone rappresenta uno dei trionfi più importanti della scienza del XX secolo.

Nota come “equazione di Dirac”, dal nome del suo scopritore Paul Dirac, essa costituisce la base di tutta la Chimica e di quasi tutta la Fisica moderna.

Trovo molto interessante provare a riavvolgere il filo del pensiero di Dirac, immedesimandoci in lui quando in una fredda serata a Cambridge nel 1928 arrivò a scrivere la sua equazione dopo essere stato tanto tempo seduto a fissare il caminetto (o così dice la leggenda).

Innegabilmente l’equazione di Dirac vanta una certa eleganza estetica, ed è per questo motivo bersaglio di una sempre crescente mercatizzazione (non è raro trovarsela stampata sulle tazze o sulle magliette).
Trovo anche io difficile resistere al suo fascino e decido quindi di raffigurarla qui in bella vista, prima di iniziare l’articolo:

L’equazione di Dirac descrive una particella libera (relativistica) di spin 1/2.
Piccolo suggerimento: prima di procedere può essere utile dare un'occhiata a due articoli più introduttivi come questo e questo. Se non ne hai voglia ora, li citerò comunque nel prosieguo, inserendoli nei punti chiave in caso tu voglia approfondire.

Schrödinger: le particelle libere come onde piane

Nel 1926 Schrödinger aveva illustrato al mondo che le particelle quantistiche potevano essere descritte da funzioni d’onda la cui forma funzionale era fissata dalla soluzione dell’equazione

In questa equazione ψ è la funzione d’onda che vogliamo trovare, e H rappresenta l’interazione tra particella e il mondo circostante. Questa interazione, agendo su ψ nel membro di destra, produce una variazione nel tempo della ψ stessa, come evidenziato nel membro di sinistra col simbolo di variazione nel tempo ∂/∂t lasciato agire su ψ.
Per una particella libera (cioè senza interazioni con il mondo circostante, o con interazioni così deboli da poter essere trascurate rispetto all’energia cinetica della particella), l’equazione di Schrödinger ha una soluzione semplicissima: un’onda piana

Se non sei familiare con quella forma curiosa per l’energia cinetica ti basti sapere che partendo da 1/2 m v2, questa può essere riscritta in una forma più conveniente sostituendo la quantità di moto p=mv.

In che senso “più conveniente”? In meccanica quantistica si usano gli operatori, che sono oggetti matematici che trasformano le funzioni d’onda in un certo modo. Non tutte le quantità a cui siamo abituati classicamente sono dei buoni operatori. La quantità di moto è un operatore che sappiamo maneggiare bene nei calcoli, al contrario della velocità che è mal definita.

L’energia relativistica, un passo oltre Schrödinger

Nel 1905 Einstein rivoluzionò la meccanica newtoniana con la teoria della Relatività Ristretta. Una delle conseguenze fu la correzione all’energia totale di una particella libera. La forma newtoniana prevedeva, come abbiamo visto, E= p2/2m. In realtà questa non è altro che l’approssimazione della versione einsteiniana una volta che consideriamo velocità molto più basse di quelle della luce, in cui si ha:

In queste formule “m” è la massa della particella, “p” la quantità di moto e “c” la velocità della luce.
A basse velocità otteniamo di nuovo la formula newtoniana per l’energia.

Le energie di legame atomiche sono solitamente così piccole da far sì che le particelle si muovano a velocità molto più basse di quella della luce. L’equazione di Schrödinger era stata creata proprio per descrivere i processi atomici, quindi all’inizio nessuno si preoccupò che non fosse relativistica, c’erano problemi ben più importanti da risolvere.
Se invece si indaga sulla scala subatomica si scopre che bisogna tenere conto delle correzioni relativistiche, proprio perché stavolta aumenta l’energia in gioco.
La strategia più naturale per rendere relativistica l’equazione di Schrödinger è quella di sostituire la vecchia forma di H con la formulazione relativistica:

La forma relativistica dell’equazione di Schrödinger.

Il problema è che, come anticipato prima, in meccanica quantistica la quantità di moto è un operatore, ed è problematico definire la radice quadrata di un operatore. Come superiamo questo ostacolo?

La Klein-Gordon e i suoi problemi

L’approccio proposto da Klein e Gordon per eliminare la radice fu quello di calcolare la variazione temporale di entrambi i membri dell’equazione relativistica, applicando ∂/∂t a sinistra e a destra

In questo conto è fondamentale sapere che l’unità immaginaria “i” è definita in modo che i2=-1

A sinistra abbiamo quindi una doppia derivazione rispetto al tempo, mentre a destra (siccome H è costante nel tempo) otteniamo ψ/∂t, alla quale possiamo sostituire l’equazione di Schrödinger stessa. Con questo piccolo trucco otteniamo che la radice quadrata sparisce.
Ora per semplificare i conti che seguiranno scegliamo di lavorare con delle unità in cui ħ=c=1 e facciamo un cambio di variabili, l’equazione di sopra diventa l’equazione di Klein-Gordon:

L’equazione di Klein-Gordon scritta in una forma più simpatica all’occhio.

L’equazione di Klein-Gordon fu il primo tentativo di relativizzare l’equazione di Schrödinger. La soluzione di questa equazione è ancora un’onda piana per una particella di massa m, solo che a differenza di prima la forma dell’equazione è immediatamente covariante sotto trasformazioni di Lorentz, in quanto P2 e m2 sono degli scalari di Lorentz: in sostanza il principio di relatività è automaticamente soddisfatto (mentre non lo era nell’equazione di Schrödinger).

Dove sta la fregatura?

L’aver mandato via la radice quadrata ha sollevato un problema irritante: l’evoluzione temporale nell’equazione di Schrödinger era espressa da un termine di primo grado ψ/∂t, mentre ora nella Klein-Gordon è espressa da un termine di secondo grado (∂2ψ/∂t2), e ciò fa sì che la densità di probabilità possa ora assumere valori non solo positivi, ma anche negativi o nulli.

Infatti i moduli quadri delle funzioni d’onda (che per la regola di Born rappresentano le densità di probabilità) possono essere calcolati tramite una particolare “ricetta” che dipende in una maniera molto precisa dal tipo di equazione dinamica da cui si parte. Si dà il caso che la “ricetta” ereditata dall’equazione di Klein-Gordon sia difettosa rispetto a quella dell’equazione di Schrödinger.
Ciò fa perdere di significato fisico tutta la struttura matematica della nostra teoria, una bella gatta da pelare!

Non c'era via di uscita? È questo il prezzo da pagare per aver cercato di introdurre la relatività nella meccanica quantistica?

L’illuminazione di Dirac

Per dei motivi che oggi non sono più rilevanti, Dirac era fortemente preoccupato dal problema della densità di probabilità nella Klein-Gordon. Per questa ragione si ossessionò al punto da forzare la matematica stessa: voleva abbassare l’ordine delle derivate temporali dal secondo grado al primo grado a tutti i costi, pur mantenendo un’equazione relativisticamente permessa. Nella sua mente la forma prediletta doveva essere, per ragioni relativistiche e di “eleganza”

In cui γ0 è un termine per ora indeterminato. Questa equazione doveva comunque essere collegata alla Klein-Gordon in qualche modo, perché questa garantisce l’invarianza relativistica. L’illuminazione arrivò quando fu colto il seguente parallelismo con la differenza algebrica dei quadrati a2-b2

dove le γμ sono degli oggetti per ora ignoti, e la notazione va intesa nel modo seguente:

j=1,2,3 indica le tre direzioni cartesiane x,y,z. Quindi x1=x , x2=y , x3=z. γP è quindi solo un modo rapido di scrivere quella somma di termini, comprendenti tutte le direzioni spaziali cartesiane.

Affinché valga l’uguaglianza con la Klein-Gordon tramite la differenza dei quadrati le misteriose γμ devono soddisfare

in cui ημν è la metrica dello spazio-tempo della relatività ristretta. Infatti per avere uguaglianza deve essere

e questa condizione può essere soddisfatta solo se vale la relazione scritta sopra, che lega la metrica ημν con gli oggetti γμ.

La richiesta di un’equazione con derivata temporale al primo ordine ha quindi generato due possibili equazioni relativistiche:

le quali descrivono particelle aventi energia di segno “opposto” (per saperne di più sulla questione dell’antimateria e l’equazione di Dirac clicca qui).

L’uguaglianza del loro prodotto con la Klein-Gordon impone poi che gli oggetti γμ debbano essere delle matrici quattro-dimensionali con delle ben determinate regole di composizione legate alla metrica dello spaziotempo. Non solo, la forma matematica di queste equazioni impone che la funzione d’onda ψ trasformi in una maniera ben precisa sotto trasformazioni di Lorentz.

Fu la prima volta nella storia della Fisica in cui una richiesta di struttura visiva della matematica portò a scoprire un’intera classe di nuovi oggetti matematici.

Tornando alla notazione con le derivate scritte in una forma più elegante:

otteniamo la forma dell’equazione di Dirac che si stampa sulle magliette:

È cruciale il fatto che ora possiamo interpretarla proprio come una sorta di decomposizione della Klein-Gordon per far sì di ottenere solo derivate di primo grado nel tempo. Nonostante ciò, è in realtà è più proficuo (dal punto di vista teorico) interpretare questa equazione come l’equazione del moto di una teoria di campo costruita per le particelle che trasformano come una rappresentazione di spin 1/2 sotto trasformazioni di Lorentz (se vuoi saperne di più sul perché classifichiamo le particelle come rappresentazioni di spin clicca qui).


PS. ho scritto un libro di testo che rappresenta proprio ciò che avrei desiderato leggere all’inizio dei miei studi di Fisica teorica, per renderla accessibile agli amatori e insegnare le tecniche matematiche necessarie a una sua comprensione universitaria. Si chiama “L’apprendista teorico” , dai un’occhiata per vedere di cosa si tratta. Il libro è acquistabile su Amazon.

Questa immagine ha l'attributo alt vuoto; il nome del file è cover_view_2.png
Questa immagine ha l'attributo alt vuoto; il nome del file è amazon_btn.jpg