GEOMETRIA E FISICA

 

G. Boscarino, S. Notarrigo, A. Pagano

Gruppo Nazionale di Storia della Fisica — Unità di Catania

 

Comunicazione presentata al Convegno Nazionale su

Peano e i fondamenti della Matematica, Modena. 22-24 Ott. 1991.

Organizzato dall’Accademia Naz.le di Scienze, Lettere ed Arti di Modena

 

 

 

 

 

 

 

La filosofia di Peano

 

 

È noto come Peano, con la sua “ideografia” , abbia portato a compimento i1 sogno di Leibniz, relativo ad un linguaggio scientifico, privo di ambiguità, capace di arrivare alle conclusioni per mezzo di un semplice calcolo simbolico.

Ma è anche noto come lo stesso Peano sia stato tagliato fuori dalle innumerevoli, e a nostro giudizio poco fruttuose, discussioni sulla cosiddeta crisi dei fondamenti della matematica.

Alcuni pensano che sia stato lo stesso Peano ad estraniarsi dalla battaglia in corso, ma noi propendiamo verso un’interpretazione che assegna agli altri il merito o il demerito (a seconda dei punti di vista, noi siamo per il demerito!) di averlo escluso.

A leggere gli interventi di Peano, così come raccolti nelle sue “Opere Scelte”,1 non c’è argomento rilevante ai fini di una discussione, che necessariamente può solo essere filosofica, sui fondamenti della matematica, che non sia stato da lui affrontato e, a nostro parere, anche risolto!2

È da riconoscere, però, che raramente si può trovare in tali scritti un qualche riferimento agli argomenti che, almeno così a noi sembra, più appas­sionavano partecipanti alla disputa. Argomenti che, tuttavia, sono ancora i principali ingredienti dell’odierna metamatematica.

Nasce, allora, il problema di capire l’essenza della filosofia di Peano che, necessariamente, doveva essere così dissimile dalle altre che si contendevano il campo, in apparente aperto contrasto tra loro.

Parliamo di contrasto solo apparente perché una particolarità le acco­munava e che drasticamente le differenziava dalla filosofia di Peano.

La particolarità in comune, tanto per darle un nome, la chiamiamo “modernismo”, in quanto opponentesi al “classicismo” difeso dal Peano.

Il paradigma del modernismo si era manifestato, già molto tempo prima, come del resto è ovvio che doveva essere, nella letteratura, nella filosofia senza altri aggettivi, e successivamente nelle scienze, prima fra tutte nell’economia politica, ed ha poi investito tutte le altre scienze, logica, matematica e fisica comprese.3

Ma non vogliamo qui toccare questi punti atti a far degenerare ogni discussione, caricandola di emozioni di non facile controllo. Del resto, l’ana­lisi di questi rivolgimenti è stata fatta da molti, a partire da Marx, ed è oggi opinione quasi generale che le cause sono da ricercare fuori dal contesto puramente scientifico, essendo rilevanti ed essenziali i fattori socio-economici.

Quindi ci limiteremo a fare un discorso un po’ più neutrale e più adatto all’Accademia di cui, peraltro, siamo parte.

C’è un punto sul quale tutti si dichiarano d’accordo: c’è il mondo dei sensi e c’è il mondo della ragione. Ma l’accordo cessa immediatamente quan­do si tratti di stabilire in che misura il discorso scientifico debba fare appello all’uno o all’altro dei due mondi. La discussione su questo dilemma diventa, parafrasando Popper, un terzo mondo.

Le risposte a tale problema sono sempre state le più varie fin dai tempi più antichi;4 e sempre hanno oscillato fortemente tra due posizioni estreme, l’una che identifica la realtà con il mondo delle sensazioni informi (il caos), l’altra con il mondo ordinato per mezzo della ragione (il cosmos).

Le posizioni di compromesso sono sempre apparse difettose e non coeren­ti, specialmente nella fisica e nelle altre scienze che devono fare riferimento ai fatti empirici; ma, anche, nella logica e nella matematica.

Esaminiamo, p. es., le posizioni epistemologiche di Einstein. Da un lato egli fa appello ad una particolare interpretazione del cosiddetto meto­do “ipotetico-deduttivo”, che secondo lo stesso Einstein dovrebbe ricevere la sua validità, solamente a posteriori, dalla verifica empirica delle conseguenze matematiche delle ipotesi; ma, dall’altro lato, per giustificare le sue ipotesi fa appello, a priori, a dei fatti empirici complessi, difficilmente analizzabi­li in termini di “elementi”, intesi come quei mattoni, i più adatti, per la costruzione dell’edificio teorico.5

Un altro tipo incoerente di compromesso fa appello ad un’errata in­terpretazione del cosiddetto “operativismo” di Bridgmann, nella falsa idea che, a partire dalle grandezze operativamente definite e dalle relazioni tra di esse empiricamente trovate, si possa costruire una teoria matematica on­nicomprensiva, come, p. es., capita nella più popolare interpretazione della meccanica quantistica.

Lo stesso problema si ripresenta, anzi si era già prima presentato, nella matematica e nella logica. Il problema dei fondamenti della matematica e degli assiomi della logica, a nostro avviso, non consiste, e non è mai consistito, nel cercare i mattoni più adatti, ma quello di decidere preventivamente l’uso che se ne voleva fare.

Se la matematica dovesse solo servire ad organizzare il discorso delle altre scienze, allora il problema dei fondamenti non si porrebbe affatto. Basterebbe usare la medicina già proposta da Peano6:

“…L’analisi del concetto di moto e la determinazione dei postulati fon­damentali, si può fare seguendo la solita via. Si scrivano tutte le proprietà che risultano dall’osservazione del moto fisico. Si scindano queste proposizioni in tante affermazioni semplici; e poi si esamini quali di queste affermazioni sono già implicitamente contenute nelle rimanenti. Procedendo avanti in questo esame, finché sarà possibile, troveremo un gruppo di affermazioni esprimenti verità irriduttibili tra loro, e che costituiscono i postulati del moto…”.

Qui Peano si riferisce al moto fisico ma la stessa ricetta, l’aveva suggerita con parole solo leggermente diverse, e, soprattutto, l’aveva concretamente usata, per determinare i postulati della geometria, dei numeri e, persino, della logica:7

“…Nel Formulario, la logica matematica viene adoperata esclusivamente come strumento per esprimere e trattare le proposizioni della matematica usuale; e non è fine a se stessa; essa viene spiegata in 16 pagine; un’ora di studio è sufficiente per sapere tutto quello che è necessario per applicare la nuova scienza della logica alla matematica…”.

Per cui gli stessi assiomi dei numeri interi8 vengono “as tratti” con lo stesso metodo sopradescritto (Peano, dice, più precisamente che se ne defi­niscono le proprietà per mezzo di una “definizione per astrazione”) a partire dalle operazioni elementari che compiamo nel misurare le grandezze fisiche per confronto diretto.

Ma, per chi volesse “liberare” la matematica dalla schiavitù verso la fisica, come hanno voluto fare Cantor e Dedekind,9 abbandonando defini­tivamente il supporto delle grandezze fisiche, bisognerà pur che trovi una soluzione al problema della coerenza degli assiomi! Specialmente quando si volesse continuare a parlare dell’“infinito” e degli “infinitesimi”10.

Ma al programma hilbertiano, come tutti dicono, è stata sbarrata la via dal Gödel, ed allora si ricorre a sotterfugi formali che, sul piano dei signi­ficati, ammontano semplicemente a ripristinare l’ambiguità tra due “idee” ben diverse che Peano aveva nettamente distinto introducendo due diversi simboli, É e Î .

Vediamo, invece, come Peano risolve il problema dei fondamenti della logica, della matematica e della fisica, tutte insieme.

La sua soluzione può essere riassunta col dire: non c’è niente da cam­biare o da inventare sulle grandiose conquiste di Democrito, Eudosso, Eucli­de, Archimede, Galilei, Newton. Resterebbe solo da inventare un linguaggio (o meglio, un’“ideografia”) adeguato per poterle esprimere senza alcuna ambiguità. Il suo calcolo simbolico è perfettamente adeguato e sufficiente.

Ma qual e la comune filosofia di questi illustri scienziati che abbiamo nominato?

1) Logica, matematica e fisica non sono separabili e sono la “scienza”.

2) Il linguaggio della scienza non puo essere il linguaggio comune, nè una sua semplice estensione, in quanto, il primo fa riferimento al “cosmos”, creato dalla ragione ed il secondo al “caos”, prodotto dalle sensazioni.

3) Il contatto tra i due linguaggi è necessario all’inizio del processo di costruzione della teoria, allo scopo di poter determinare gli assiomi, ma sempre a partire dalle più semplici ed elementari operazioni fisiche; ed è ancora necessario alla fine, per la spiegazione dei fatti empirici, siano questi il prodotto di semplici osservazioni o di raffinati esperimenti. Per determinare gli assiomi non si può partire, da fenomeni complessi, la spiegazione dei quali, invece, deve essere proprio il risultato finale della teoria.

4) La coerenza della teoria, sia essa logica, matematica o fisica, è assicu­arata dalla adeguatezza degli assiomi alle fattibili operazioni fisiche elementari. L’indipendenza di ogni singolo assioma si può solo accertare se vi sono mo­delli fisici concreti e funzionanti che obbediscano a tutti gli altri assiomi della teoria ma falsificano quello di cui se ne vuole provare l’indipendenza. Per qu­anto riguarda la completezza, nessuno potra mai sapere nemmeno cosa mai significhi, se non in relazione ad un determinato campo fenomenico.

Con tali ricette, gli antichi non potevano mai inventare la metamatema­ tica, dal momento che non ne sentivano il bisogno.

Si può concludere, anche, che gli antichi, e Peano con essi, non sentivano il bisogno della “fisica matematica”, intesa come la matematizzazione della fisica; dal momento che, in modo del tutto naturale, andavano sviluppando una “matematica fisica”, cioè quella matematica modellata sulle operazioni fisiche, e non riuscivano a concepire nessun altro tipo di matematica, specialmente di quella che si fa discendere dagli imperativi deontologici che nascono dalle filosofie platoniche o aristoteliche.

 

 

 

Il calcolo geometrico di Peano

 

 

Come illustrazione delle tesi qui sostenute, mostriamo ora alcune conse­guenze che si possono tirare dall’impostazione del “Calcolo Geometrico” di Peano.

Peano fa risalire a Leibniz il primo tentativo nella direzione di un’al­gebrizzazione degli enti geometrici, che non facesse uso della intermediazione delle coordinate, e nota che, successivamente, sono state sviluppate diverse specie di calcolo geometrico.

I più interessanti, a suo giudizio, sono il Calcolo baricentrico di Möbius (1827), quello delle Equipollenze di Bellavitis (1832), quello dei Quaternioni di Hamilton (1853) e, infine, il calcolo geometrico del Grassmann (1844), quest’ultimo basato sul concetto di “forma esterna” e di “prodotto esterno” tra forme.

Tuttavia tali opere, la cui importanza solo recentemente comincia ad es­sere riconosciuta in alcuni settori della fisica matematica, non hanno trovato, fino ai nostri tempi, molto favore, né tra i fisici, nè tra i matematici.

Maxwell si permise di usare il calcolo quaternionico di Hamilton nel suo famoso trattato sulla teoria dell’elettromagnetismo; ma, da un lato, si è limitato ai quaternioni retti (che oggi si usa, impropriamente, chiamare vettori) e, dall’altro, li ha usati nel linguaggio delle coordinate, sminuendone, così, la portata innovativa.

Come è noto, intorno al 1888, tutta la materia è stata ripresa dal Pe­ano,11 semplificata nella forma e nei simboli e unificata sulla base del più comprensivo calcolo del Grassmann; ma, soprattutto, riscritta in forma “as­soluta”, cioè in modo indipendente da qualunque sistema di coordinate e da qualunque sistema di unità di misura.

Ma nemmeno tale importantissima opera ebbe successo, se non in mini­ma parte e ad opera di alcuni collaboratori del Peano che hanno estratto, dal sistema completo di calcolo, quello che essi chiamavano “il sistema minimo”, che oggi è universalmente conosciuto come calcolo vettoriale.

Tuttavia tale calcolo, impostosi in passato soprattutto tra i meccanici ra­zionali, veniva accettato solo nella sua forma simbolica, ma, sostanzialmente, tradito nei suoi intendimenti, quali venivano “propugnati” dai suoi principa­li sostenitori, come Burali-Forti, Boggio, Burgatti, Marcolongo, Bottasso, Pensa, ecc. che condussero una lunga battaglia con scritti fortemente pole­mici.

Il succo di tale polemica ha una notevole rilevanza per i metodi e il ruolo della fisica teorica.

Nell’idea di Peano e dei suoi collaboratori, il calcolo aveva valore in quanto si poteva con esso parlare della realtà così come ce la rappresentiamo nella nostra mente. Gli enti di cui parliamo (punto, retta, segmento, massa, forza, ... ), noi li pensiamo indipendentemente dal sistema di coordinate; e i numeri che esprimono il risultato delle nostre misure sono solo l’ultimo atto; tali misure vengono effettuate sempre in relazione a ben determinati sistemi di riferimento che sono i più vari, a seconda del caso concreto, e spesso non i più semplici dal punto di vista della matematica.

Se una relazione vale per gli enti, essa deve valere in tutti i possibili sistemi di coordinate e per tutti i possibili sistemi di unità di misura, e quindi la notazione deve essere tale da non avere bisogno di una tale esplicita simbolizzazione, la quale, invece, risulta assolutamente necessaria quando la relazione viene espressa mediante le coordinate.

La maggior parte degli utenti, invece, accettava le relazioni tra sim­boli (rappresentanti gli enti) come semplici “tachigrafi” delle coordinate, e riconosceva come reali solo le “misure”, almeno a parole, ma nei fatti solo i “numeri”, confondendo le “misure” con le “misurazioni”; cose tra le quali esiste una differenza concettuale incolmabile, in quanto le prime sono semplici numeri e le seconde, invece, ben determinate operazioni fisiche. Alcuni effetti di tale confusione si registrano nella attuale (ma nello stesso tempo antichis­sima) problematica relativa ai concetti di spazio, tempo e movimento.

Negli ultimi tempi, alcuni fisici matematici, ognuno per conto suo e fuori dal paradigma dominante, sono andati riscoprendo chi il calcolo qu­aternionico di Hamilton, chi, e sono i più, il calcolo delle “forme esterne” del Grassmann; ma, ancora una volta, nel linguaggio delle coordinate (quando non è possibile farlo globalmente si ricorre a “carte” e “atlanti”) e l’aggettivo “assoluto” (sempre lui!), che dai peaniani (chiamiamoli così) veniva inteso co­me “indipendente dal sistema di coordinate prescelto” (che comprende anche l’assegnazione delle unità di misura prescelte) ora viene inteso come “indipen­dente dallo spazio euclideo in cui può sempre essere immerso” che, automa­ticamente (e senza ragione), si traduce con “eventualmente non-euclideo”, dal momento che non si fa più il benché minimo riferimento alle unità di  misura12.

Va notato, tuttavia, che questi approcci moderni (ma, piuttosto, bi­sognerebbe dirli antichi anche se sconosciuti) allo studio della meccanica hamiltoniana rappresentano un notevole progresso metodologico rispetto ai metodi che ancora si ritrovano su quasi tutti i libri di testo di meccanica classica, dove lo spazio delle fasi viene assimilato ad uno spazio euclideo; quando che, invece, non è assolutamente possibile definirvi alcun concetto di distanza.

Nei nuovi approcci, si dice che un sistema hamiltoniano viene descritto nello spazio delle fasi, il quale ha struttura di “varietà simplettica”, la quale ultima viene contrapposta alle “varietà riemanniane”. Ma poi si continuano tranquillamente a sommare impulsi con coordinate o anche vettori con mul­tivettori di qualunque grado, come si può vedere, p. es., nei libri citati nella nota successiva.

Strana situazione questa: si chiamano non euclidei degli spazi (?), che si possono sempre immergere nello spazio fisico (sempre euclideo per le de­finizioni di distanza, di area e di volume) e si fanno diventare euclidei degli spazi (?) che non lo possono mai essere se il termine “grandezza fisica” deve continuare ad avere un qualche senso!

Data l’artificiosità e l’astrattezza di questi approcci moderni alla meccanica13, pensiamo che, almeno nella didattica, sia preferibile riprendere l’ar­gomento a partire direttamente dal livello, già abbastanza alto, raggiunto dal Peano.

Peano cercò di fare un po’ di propaganda in favore del suo calcolo ge­ometrico per gli usi della fisica; ma, come è ben noto, fu bruscamente fermato, anche a causa della ben nota polemica col Volterra.

Nella sua prima esposizione, già citata nella nota 11, Peano vi fa prece­dere un capitolo sui simboli della logica, che, a quella data, non hanno ancora raggiunto la maturità che si ritroverà poi nel “Formulario”; e, per gli enti geometrici, usa dei termini che saranno successivamente modificati nel “For­mulario”, probabilmente per evitare di confonderli con i diversi significati che, agli stessi termini, venivano usualmente attribuiti.

Per tale ragione, noi useremo i termini del “Formulario” e, dato il nostro scopo, ci permetteremo di modificare l’ordine della presentazione ed alcuni simboli, e anche di estenderne le conseguenze dal punto di vista della fisica, ma sempre nello spirito della filosofia di Peano, come sopra l’abbiamo deli­neata; ma, naturalmente, senza dare dimostrazioni, per le quali rimandiamo alle opere di Peano e dei suoi collaboratori.

Ma, prima di tutto, faremo uso delle “idee” (cioè dell’“ideografia”, ma senza la “grafia”!) di Peano per ricostruire l’idea della meccanica che, a nostro giudizio, si era andata sviluppando negli ambienti pitagorici, per arrivare alla sintesi archimedea, alla quale fa esplicito riferimento il Galilei, per poi culminare nella grandiosa opera di Newton, il quale sembra, addirittura, che attribuisse ai pitagorici la stessa idea della legge dell’inverso del quadrato delle distanze.14

Partiamo dalla teoria dei contrari o, in linguaggio moderno, delle proprietà complementari, come professata dai pitagorici, che esporremo alla luce delle precisazioni parmenidee e con l’aiuto dell’ideografia peaniana.

Per i pitagorici la realtà è niente altro che la ricostruzione razionale delle impressioni sensoriali che sono solo apparenza. Noi, certamente, inventiamo le proprietà a partire dal dato dei sensi ma poi, nella ricostruzione razionale, sono le proprietà che devono costituire l’elemento” primario, il “principio”. Gli individui possono solo essere definiti per mezzo di esse, e non viceversa, come in seguito hanno potuto pensare Aristotele e Russell (per citare solo i capiscuola più influenti).

Se di qualche individuo asseriamo semplicemente che è, abbiamo sempli­cemente enunciato la banalità, che l’unica proprietà che lo caratterizza è quella di “essere”, nel senso parmenideo del termine. Ma questa è propro l’unica proprietà il cui complemento non può avere individui. In altre pa­role la proprietà complementare dell’“essere” è niente altro che la proprietà assurda, il “nulla” di Parmenide.

Quindi, ogni altra proprietà, se non è quella banale di “essere” o quella assurda di “non essere”, deve essere non vuota e anche la sua complementare deve essere non vuota.

Per brevità, nel seguito, indicheremo l’essere con il simbolo Ú, e il non essere con .

Se inventiamo la proprietà di “essere fisico” ed asseriamo che essa non coincide né con Ú, né con Ù, devono necessariamente esistere individui non fisici. Per caratterizzare gli individui fisici, assegnamo ad essi la proprietà del­l’estensione, che possiamo definire geometricamente mediante una relazione tra gli individui dell’essere fisico.

Per caratterizzare ulteriormente l’essere fisico, facciamo un’altra dico­tomizzazione inventando la “materia=ente=atomo” e la “non materia=non ente=niente=vuoto”; attribuendo alla materia il movimento. Gli individui dell’essere fisico li chiameremo “punti”, quelli della materia “punti materiali”. Un “corpo” è un sistema di punti materiali.

Consideriamo un corpo di N punti materiali dello spazio fisico, che indichiamo con  (i= 1,2...,N).

Porremo  , essendo mi  la “massa di  e Pi  il “punto ge­ometrico” in cui immaginiamo localizzata la massa.

Chiamiamo sistema meccanico l’insieme di tali punti materiali.

Indicheremo tale sistema con la scrittura:

 

(*)                                                                  .

 

Il sistema costituito da due soli punti materiali , , sara:

 

  .

 

Il significato del segno + e del segno di sommatoria nella (*), è con­venzionale, tuttavia supporremo che tale operazione goda della proprietà commutativa” e della proprietà “associativa”:

 

  ,

 

 

  ,

 

Faremo pure l’ipotesi:

 

mi Pi = Pi mi  .

 

Permetteremo, naturalmente, che un sistema meccanico possa anche es­sere costituito da un solo punto materiale.

Se è un sistema meccanico di N punti materiali, , scrivere­mo, per esso, anche:

 

 .

Chiameremo , la “massa del sistema” e

  ,

il baricentro del sistema”.

Daremo significato al prodotto di due punti geometrici A, B, e lo scriveremo semplicemente AB, sottintendendo il segno dell’operazione prodotto.

Il  significato di AB sarà per noi:

“AB é un segmento di retta limitato dai punti A e B e orientato da A verso B”.

Lo chiameremo semplicemente “bipunto”.

La lunghezza di AB la indicheremo con | AB | = | BA |.

Da questa definizione ne viene che il nostro prodotto deve essere “anti-commutativo”, cioè:

 

AB = – BA  ,

 

ma assumeremo che sia anche “associativo”:

 

A(BC) = (AB)C = ABC  ;

 

per cui daremo significato anche al prodotto di tre punti:

“ABC è il triangolo di vertici A, B, C e di area | ABC | che pensere­mo orientata, immaginando che tale area venga descritta da AP con P che descrive BC da B verso C”.

Lo chiameremo “tripunto”.

Questa regola di orientazione viene ad essere d’accordo con l’anticommutatività del prodotto tra punti:

 

ABC = – BAC = BCA.

 

Analogamente, possiamo dare significato anche al prodotto di quattro punti:

“ABCD é il tetraedro di vertici A, B, C, D e di volume | ABCD |, che penseremo orientato, immaginando che tale volume venga descritto da ABP con P che descrive CD da C verso D”.

Lo chiameremo “quadripunto”.

Se il nostro spazio è lo spazio fisico, esso avrà solo tre dimensioni e quindi converremo che il prodotto di cinque o più punti sia sempre nullo.

Converremo, anche, che il rapporto tra due quadripunto sia un numero reale che rappresenti, in valore e segno, il rapporto tra i volumi dei due tetraedri corrispondenti.

Allora, “fissato un volume unitario”, secondo le convenzioni sui sistemi di misurazione coerenti, ABCD può rappresentare, a seconda dei casi, sia il volume orientato che il numero che ne costituisce il valore.

ABCD = 0 significherà, allora, che i quattro punti sono complanari”.

E quindi, significherà anche: A giace nello stesso piano di BCD; le rette su cui giacciono, rispettivamente, AB e CD si incontrano in un punto o sono parallele, e così via di seguito.

Diremo che due quadripunto sono uguali se i loro volumi orientati sono uguali, cioè, quando, essendo u il volume unitario, si ha, per definizione:

 

  .

 

Quindi, il segno =, posto tra i due quadripunto, non si deve intendere come un’identità logica, ma come un’equivalenza che fa riferimento solo ai volumi orientati e non alla posizione effettiva dei tetraedri nello spazio fisico.

Perciò, ha senso sommare due quadripunto per ottenere un terzo quadri punto, che può essere nullo, nel caso che i due quadripunto abbiano volumi eguali ma siano di segno opposto.

In altre parole, ponendo l’unità di volume = 1, i quadripunto si compor­tano come dei numeri reali.

Ed ha senso una loro qualsiasi combinazione lineare:

 

(**)                                                                ,

 

dove v e i vi  sono quadripunto e gli ai  sono dei numeri reali.

Dalle precedenti convenzioni deduciamo che se A è un tripunto e A e B sono punti, allora l’uguaglianza:

 

AA  = BA

 

significherà che AB è parallelo adA . Così,

 

AA    > 0

           BA                         .

 

significherà che A e B stanno dalla stessa parte rispetto al piano su cui giace A ; e, se il rapporto precedente è invece negativo, allora A starà da una parte e B dall’altra rispetto al detto piano.

Se α e β sono bipunti, ovviamente sarà:

 

αβ = βα   ;

 

cioè, il prodotto tra bipunti è commutativo.

Per definizione,   diremo che un tripunto,  A ,   è nullo (A = O),  se qualunque sia il punto P, si ha

A P=0   .

Il che significa che l’area del triangolo corrispondente è nulla; se A = ABC = 0 i tre punti A, B, C, sono “collineari”, cioè, stanno sulla stessa retta; se α e un bipunto, Aa = 0 , significa che il punto A giace sulla retta su cui giace α.

Per definizione, diremo che due tripunti sono uguali (A = B  ) se per qualunque punto P si ha:

A P= B  P .

Dal che si deduce che condizione necessaria e sufficiente affinché due tripunti siano uguali è che giacciano sullo stesso piano e che abbiano la stessa area orientata, indipendentemente dalla loro posizione relativa nel loro piano.

Se A e B sono punti e α è un bipunto, l’uguaglianza

 

α A = α B  ,

 

significherà che α e AB sono paralleli.

Un bipunto α si dice nullo (α = 0) se, qualunque sia il bipunto ξ si ha: α ξ = 0.

Se ne deduce che la lunghezza del segmento è nulla; o, anche, che AB = 0 significa che i due punti A e B sono “coincidenti”, cioè in pratica sono lo stesso punto.

Per definizione, due bipunti si dicono uguali (α = β) se per qualunque bipunto ξ si ha: α ξ = β ξ .

Se ne deduce che condizione necessaria e sufficiente perché due bipunti siano uguali è che giacciano sulla stessa retta e che le loro lunghezze orientate siano uguali.

Quindi AB = AC significherà che B e C sono coincidenti.

Due punti sono uguali solo se essi coincidono.

Ne segue che, per due punti materiali e , scrivere  , significherà che essi sono nello stesso punto geometrico ed hanno la stessa massa. Mentre, se con gli stessi due simboli indichiamo due sistemi meccanici con più punti materiali, l’uguaglianza tra i simboli significherà che i due sistemi hanno lo stesso baricentro e la stessa massa totale; in particolare, se il sistema si muove (il movimento si deve intendere solo come movimento relativo tra i punti del sistema, non avendo alcun significato il movimento rispetto ad uno spazio assoluto in quiete assoluta, ché non abbiamo alcun modo di verificare),15 allora il “sistema meccanico”, per come formalmente definito, resta uguale a se stesso, indipendentemente dalla posizione relativa dei singoli punti durante il moto.

Da quanto detto risulta che si può sempre dare un significato ad un’espressione simbolica come la (**) della pagina precedente:

1) Se i vi sono punti geometrici e gli ai , sono i valori delle masse che si immaginano in essi concentrate, allora v rappresenta il punto materiale corrispondente al baricentro del sistema meccanico in cui si immagina con­centrata la massa totale del sistema. Ma possiamo, anche, pensare che gli ai siano i valori delle cariche elettriche che si immaginano concentrate nei punti vi , allora v può rappresentare il centro delle cariche. Ma notiamo che, in questo caso, la somma delle cariche può risultare nulla, in quanto le cariche possono essere sia positive che negative; in tal caso, il centro delle cariche non può essere individuato, e tuttavia si può dare un significato all’ente v anche in questo caso degenere. Quindi consideremo, in astratto, l’espressione (**) e, se i vi sono dei punti geometrici, allora diremo che v è una “formazione geometrica di primo grado”.

2) Se i vi sono dei bipunti, dal punto di vista geometrico (cioè, se si considerano solo le grandezze geometriche: angoli, lunghezze, aree e volu­mi), v rappresenterà la somma di N segmenti orientati che, generalmente, è un segmento orientato. Ma, anche qui, si può avere una degenerazione, no­nostante la quale, si riesce tuttavia a dare un significato geometrico (o anche fisico a seconda del significato degli ai) all’ente v. In astratto: se i vi sono dei bipunti, allora diremo che v è una “formazione geometrica di secondo grado”.

3) Se i vi sono dei tripunti, a meno della solita possibile degenerazione, allora v rappresenterà un’area orientata (o, a seconda del significato degli ai , qualche altra grandezza fisica dipendente linearmente dall’area) e, po­iché anche in questo caso si può dare significato alla situazione degenere, in astratto, parleremo di “formazione geometrica di terzo grado”.

4) Se i vi sono dei quadripunto, v sarà sempre un volume, il caso degenere non ha alcun interesse, perché viene ad essere semplicemente un volume nullo (ciò dipende dal fatto che abbiamo assunto che lo spazio fisico ha solo tre dimensioni, il risultato sarebbe diverso in spazi astratti con più di tre dimensioni; spazi che spesso vengono considerati in fisica). In astratto: se i vi sono quadripunto diremo che v è una formazione geometrica di quarto grado”.

Riassumendo:

Due formazioni della stessa specie si possono sommare per dare origine ad un’altra formazione della stessa specie (la specie è decisa dal significa­to degli ai , la quale può solo essere decisa operativamente; la stessa specie implica lo stesso grado ma non viceversa), ed esse si possono moltiplicare per un numero, restando della stessa specie e quindi anche dello stesso grado.

Quindi se S ed S sono formazioni della stessa specie e se a e b sono numeri si ha:

 

 

Due formazioni di qualunque grado possono moltiplicarsi fra loro (ter­mine a termine) di modo che se S e T sono, rispettivamente, di grado s e t (naturalmente s + t £  4) si otterrà una formazione di grado s + t .

Possiamo considerare i numeri reali come formazioni di grado zero, cioè rapporti di grandezze della stessa specie.

Se R, S, T sono formazioni di specie opportuna si ha:

 

R (S+T) = RS + RT  ,

 

(S+T) R = SR + TR  ,

 

R (ST) = (RS) T = RST  ,

 

e, se a è un numero:

 

(aR) S  = R (aS)  =  aRS  .

 

Se R = S e R ′= S , allora si avrà:   R R ′= S S ′ .

Nel seguito chiameremo “massa”, la somma dei coefficienti delle forma­zioni di primo grado, indipendentemente dal significato fisico dei coefficienti numerici della formazione; questo ci è permesso per il fatto che, nello svilup­pare il calcolo algebrico che abbiamo istituito, ci occuperemo solo di relazioni puramente formali.

Ai nostri fini, enunceremo solo alcuni teoremi, naturalmente senza le dimostrazioni, che sono date nella citata opera di Peano.

“Se A e B sono punti, e a, b sono numeri, tali che a+b ¹ 0, allora esiste sempre un “unico” punto C tale che (a + b)C = aA + bR”.

Se, in particolare, a e b sono masse, C è il baricentro del sistema costituito dai due punti materiali aA e bB.

Come corollario, si ha che se tre punti A, B, C sono allineati, allora si possono sempre trovare due numeri, a, b, tali che (a + b)C = aA + bB.

Per cui possiamo enunciare il seguente inportante teorema:

“Qualunque formazione di primo grado di massa non nulla si può sempre ridurre, in un modo solo, a un punto solo (baricentro) moltiplicato per un coefficiente numerico (massa)”.

Ma vediamo che succede se la “massa” è nulla (caso ovvio quando, con il termine generico “massa”, vorremo intendere “carica elettrica” o “massa magnetica”).

Sia  una formazione di primo grado e sia ; preso ad arbitrio un punto Q, possiamo sempre scrivere:

Ma la formazione entro parentesi ha massa 1 e quindi per il teorema precedente è riducibile ad un punto P con coefficiente unitario.

Quindi .

Chiameremo “vettore” la differenza di due punti.

Si può dire che una formazione di primo grado degenera nel punto al­l’infinito (cioè nel punto improprio); più precisamente, in una direzione, un verso e una lunghezza.

Un altro possibile significato geometrico per una generica formazione di primo grado è quello di una stella di rette nello spazio; rette passanti per un punto (in effetti si tratta di segmenti orientati, obbligati a scorrere sulle rette della stella; ma, in geometria proiettiva, si fa astrazione dalle lunghezze, come anche dalle aree e dai volumi). Tale stella degenera in un fascio di rette parallele (punto all’infinito) quando la “massa” tende a zero.

Quindi:

“Una formazione di primo grado con massa nulla è sempre riducibile, in un sol modo, a un vettore”.

E quindi:

“Una formazione di primo grado è sempre riducibile a un punto con massa o a un vettore” (la disgiunzione si deve intendere esclusiva).

È importante notare la differenza tra un vettore, il quale è una forma­zione di primo grado, e un bipunto che, invece, è una formazione di secondo grado: il primo è caratterizzato da una lunghezza, una direzione e un verso; il secondo è caratterizzato da una lunghezza, una retta e un verso.

Due vettori paralleli con la stessa lunghezza e con lo stesso verso sono lo stesso vettore, non così per due bipunti che, invece, saranno lo stesso bipunto solo se stanno sulla stessa retta (tuttavia, l’uguaglianza si ha indipendente­mente dalla loro specifica posizione sulla retta).

Se a, b, c, u sono quattro vettori dello spazio, è sempre possibile trovare tre numeri p, q, r tali che si possa scrivere:

 

u = pa + qb + rc  .

 

Se S è un punto la cui distanza da PQR è uguale all’unità di misura, che è stata stabilita per le lunghezze, allora il rapporto

 

APQR  

SPQR

 

rappresenta la distanza del punto A dal piano di PQR, presa col segno + o col segno -, a seconda che A ed S stiano dalla stessa parte o da parti opposte rispetto al piano di PQR.

 

 

***

 

Se AB è un bipunto, diremo “vettore di AB ”, il vettore B - A.

Per definizione, porremo:

 

| B - A | = | AB |  .

 

Ogni bipunto si può sempre considerare come il prodotto Aa di un punto A per il suo vettore a. Infatti basterà porre B = A + a e si avrà:

 

AB = Aa  .

Ogni bipunto si può sempre considerare come la somma di più bipunti con coefficienti unitari.

Con il calcolo geometrico su esposto si può risolvere qualunque proble­ma di fisica o di geometria in forma simbolica assoluta, cioè senza bisogno di menzionare le coordinate; come, al contrario, è necessario fare in geometria analitica. Anche se, quando si vuole, si possono sempre introdurre esplicitamente le coordinate.

Ma enunciamo altri importanti teoremi.

“Qualsiasi bipunto si può trasformare in un altro bipunto avente per origine un punto arbitrario della retta del primo e per vettore quello del bipunto dato”.

“La somma di più bipunti con la stessa origine è un bipunto che ha la stessa origine ed il cui vettore è la somma dei vettori dei bipunti dati”.

“La somma di un qualsivoglia numero di bipunti, le cui rette passano per uno stesso punto, é un bipunto passante per detto punto e che ha per vettore la somma dei vettori dei bipunti dati”.

“La somma di due bipunti paralleli, ma con la somma dei loro vettori non nulla, è riducibile a un bipunto parallelo ai primi due ed il suo vettore è la somma dei vettori dei due bipunti dati”.

In conclusione, raccogliendo tutti i risultati precedenti:

“Qualsiasi formazione di secondo grado, in un piano, con la somma dei loro vettori non nulla, è sempre riducibile a un solo bipunto il cui vettore è la somma dei vettori dei bipunti della formazione; se i bipunti della formazione sono tutti paralleli, l’origine sarà il baricentro delle origini, avendo preso, come masse, numeri proporzionali alle lunghezze dei vettori partecipanti alla somma; se la somma dei vettori è nulla, la formazione è sempre riducibile alla somma di due bipunti aventi vettori uguali e di segno contrario, uno dei due bipunti si può assegnare ad arbitrio nel piano (in meccanica si chiama coppia, qui la chiameremo bivettore, perché si può intendere sempre come il prodotto di due vettori).

Notiamo che un bivettore si può anche rappresentare come la somma dei tre bipunti che si possono individuare in un dato tripunto e che tale somma non e il perimetro di quel triangolo che corrisponde al tripunto ABC; il perimetro è infatti: | AB | + | BC | + | CA |  .

Diremo che un vettore a è parallelo ad un bivettore bc se i vettori a, b, c sono paralleli ad uno stesso piano; cioè, se abc = 0.

Diremo che due bivettori ab e cd sono paralleli se a, b, c, d sono paralleli ad uno stesso piano; cioè, se abcd = 0.

Tutto questo ci permette di dire che una formazione di secondo grado, il cui vettore sia nullo, degenera in una retta all’infinito o, che è la stessa cosa: un fascio di piani attorno ad una retta, degenera in un fascio di piani paralleli orientati e di data giacitura, che può essere individuata da un vettore normale a detti piani.

Vale, naturalmente, lo stesso discorso che abbiamo fatto nel caso dei vettori, cioè: anche se in geometria proiettiva non sono definite lunghezze, areee e volumi, per cui siamo autorizzati ad usare il linguaggio precedente, bisogna ricordare che il bivettore rappresenta l’area di un triangolo con una giacitura ed un verso; la differenza con un tripunto è che quest’ultimo è obbligato a stare in un piano determinato, mentre due triangoli con la stessa area, con lo stesso verso e con la stessa giacitura sono rappresentati dallo stesso bivettore, quindi se spostiamo un triangolo parallelamente a se stesso il bivettore corrispondente non muta, mentre il tripunto corrispondente varia (tuttavia, il tripunto resterà immutato se il triangolo si sposta sullo stesso piano).

Si può enunciare la proposizione seguente:

“La somma di quanti si vogliano bivettori nello spazio è sempre riducibile ad un solo bivettore”.

Raccogliendo i risultati precedenti possiamo affermare:

“Una formazione di secondo grado nello spazio è sempre riducibile ad un bipunto avente origine in un punto arbitrariamente scelto ma con vettore (che potrebbe, eventualmente, anche essere nullo) che è la somma dei vettori della formazione, più un bivettore (che potrebbe, eventualmente, anche essere nullo)”.

Cioè, se  è una formazione di secondo grado allora può sempre porsi:

 

 ,

 

dove α è un bipunto e A un bivettore.

Quindi:

“Una formazione di secondo grado è sempre riducibile alla somma di due soli bipunti”.

In meccanica le forze sono rappresentate da bipunti; allora, con questo nuovo significato concreto per gli astratti bipunti (notiamo che stiamo usando gli aggettivi concreto e astratto con significato relativo, come è necessario nella scienza), le conclusioni precedenti possono essere ritradotte:

“Un qualsiasi sistema di forze può essere sostituito in infiniti modi con la somma di due sole forze; si può prendere ad arbitrio la retta d’azione di una delle due forze purché la somma dei momenti delle forze del sistema (cioè la somma delle coppie, o momento totale delle forze), rispetto a tale retta, non sia nulla e tale retta non sia parallela alla risultante delle forze”.

Abbiamo, così, ritrovato il teorema centrale della statica dei sistemi di punti materiali.

 

***

 

“La somma di due tripunti di uguale grandezza e di segno opposto è un trivettore, cioè il prodotto di tre vettori”.

“La somma di più tripunti, se la somma dei loro bivettori è diversa da zero, si riduce a un solo tripunto; se invece è zero, si riduce ad un trivettore”.

Il prodotto di un punto per un trivettore dà il volume di un tetraedro, indipendente dalla posizione del punto.

Analogamente ai casi precedenti, un trivettore, in geometria proiettiva, può rappresentare un piano all’infinito.

Avendo fissato il volume unitario u, indicheremo con Ω il suo trivettore, e per qualunque punto dello spazio si avrà: O Ω  =  u.

La massa di una formazione di prima grado sarà:

Quindi, se , significa che  è un vettore.

Se , allora   è il baricentro di .

Se è una formazione di quarto grado, il suo trivettore sarà dato da:  .

Si dimostra che, dati tre vettori arbitrari a, b, c, tali che abc ¹ 0, allora ogni altro vettore dello spazio si può esprimere come una loro combinazione lineare:

 

v = xa + yb + zc .

 

E i tre numeri x, y, z si dicono le coordinate di v, rispetto ad a, b, c.

Se i tre vettori coincidono con l’usuale terna ortogonale di versori i, j, k, usualmente si pone ijk = 1.

In termini delle rispettive coordinate rispetto alla generica terna a, b, c, per un bivettore si ha:

 

v v′ = (yz - yz)bc + (zx -  zx)ca + (x y - x y)ab ;

 

per cui, un qualunque bivettore si può porre sotto la forma:

 

V = αbc + βca + γab.

 

In termini delle rispettive coordinate il prodotto di un vettore per un bivettore vale:

 

vV′ = (xα′ + yβ′ + z γ)abc.

 

E un prodotto di tre vettori vale:

.

 

Siano i, j, k i tre vettori di riferimento (non necessariamente ortogonali tra loro, né con la stessa lunghezza), costruiamo i bivettori

 

I = jk ,

 

J = ki ,

 

K = ij ,

 

siano:

 

v1 = x1i + y1j + z1k ,

 

v2 = x2i + y2j + z2k ,

 

V1 = X1I + Y1J + Z1K ,

 

V2 = X2I + Y2J + Z2K ,

 

allora si avra:

 ;

 

.

 

Se prendiamo i, j, k ortogonali tra loro e poniamo ijk = IJK = 1, le due matrici esprimono (almeno per quanto riguarda i numeri) l’usuale prodotto vettoriale: v1 Ù v2.

Ma vediamone il significato geometrico.

Definiamo un operatore , tale che, operando su di un bivettore, A, produca un vettore, a, tale che la sua direzione sia ortogonale al piano di A, il verso sia concorde al verso dell’area orientata stabilito per A e con lunghezza uguale, in numero, all’area di A; lo chiameremo, usando la terminologia di Hamilton e di Peano: l’“indice di A”.

Tranne che in particolari situazioni, useremo la stessa lettera, scritta in minuscolo, per denotare l’indice di un bivettore, che invece scriveremo in maiuscolo:

 

a = A .

 

Notiamo che con tale definizione l’usuale prodotto vettoriale si può scri­vere:

 

a Ù b =  ab .

 

L’operazione indicata da (che fa passare da bivettori a vettori) è biuni­voca e quindi possiamo introdurre l’operatore inverso che indicheremo con T (che fa passare da vettori a bivettori), cioè:

 

( a = A )   =  ( A =  T a ) ;

 

e quindi:

 

T A  = A ;      T a  = a .

 

Dalle definizioni segue:

 

( a = b ) = ( T a = T b ) ,

 

( A = B ) = ( A = B ) ,

 

T ( a + b ) =  T a + T b ,

 

( ab ) = T a T b  ,

 

a T b  = b T a   ,

 

( aV + bW )  =  a V   +   b W  ,

 

T V W  = V W  , 

 

V W  =  W  V  .

 

(La penultima equazione e da considerare, qui, come una definizione nominale, dal momento che in uno spazio tridimensionale non ha senso il prodotto di due bivettori. Tuttavia la formula si dimostra come teorema dopo avere introdotto il “prodotto regressivo”, o “intersezione”, che qui non è necessario introdurre).

Il prodotto scalare fra due vettori, lo possiamo definire con:

 

a × b  =  a T b  .

 

Una qualunque formazione di primo grado nello spazio si può sempre esprimere mediante le sue “coordinate”, rispetto a un arbitrario sistema di riferimento, costituito da quattro arbitrarie formazioni di primo grado tutte distinte tra loro:

Siano , , , , le quattro formazioni di riferimento, con  ¹ 0, allora ogni formazione di primo grado, , può scriversi mediante le coordinate x1, x2, x3, x4:

 

 .

 

Una qualunque formazione di secondo grado, , si può esprimere me­diante sei coordinate:

 

 .

 

Una qualunque formazione di terzo grado, , si esprime mediante quat­tro coordinate:

 

 ,

avendo posto:

 

=

 

  =

 

=

 

    =  .

 

Le coordinate di una qualunque formazione si possono sempre esprimere come rapporti di formazioni di quarto grado (cioè, di volumi orientati di tetraedri):

 

 , ecc.

 

 , ecc.

 

 , ecc.

 

Il  prodotto di quattro formazioni di primo grado, (i= 1,... ,4), di coordinate, rispettivamente, xi, yi, zi, ti, varrà:

 

.

 

Poiché le formazioni di primo grado possono essere punti o vettori (in ogni caso un punto “proiettivo”, proprio o improprio), abbiamo diverse pos­sibili scelte per il sistema di riferimento. La scelta avverrà secondo la co­modità e l’opportunità del problema concreto in esame; ovviamente, sara sempre possibile passare da un sistema di riferimento ad un altro mediante una trasformazione di coordinate”.

Diamo alcuni esempi usuali di sistemi di riferimento.

Se si scelgono quattro punti si avranno le coordinate “baricentriche”.

Se scegliamo , , ,  ,   con i × j = i × k = j × k = 0 e i2 = j2  = k2  = 1, si otterranno le coordinate cartesiane ortogonali ed ogni punto si potrà esprimere con:

 

P = O + x i + y j + z k .

 

In quest’ultimo sistema di coordinate, una formazione di secondo grado si può scrivere:

 

.

 

Si ha:

 

.

 

***

 

Le formazioni geometriche, come qualsiasi altro ente, possono essere costanti o variabili in funzione di uno o più parametri, come, p.es, il tempo o un punto o una qualsiasi altra formazione geometrica. Ad esse, quindi, si possono facilmente estendere le nozioni di limite, derivata, integrale, ecc.

Sia una formazione di primo grado di massa non nulla che vari con continuità in funzione del tempo t.

Consideriamo il rapporto incrementale:

 

 .

 

Se consideriamo il parametro t come una formazione di grado zero, cioè un numero, allora tale rapporto sarà un vettore, venendo ad essere una for­mazione di primo grado di massa nulla (naturalmente, se fosse già stato un vettore, sarebbe rimasto tale).

Al limite, per t2 tendente a t1, avremo la derivata della rispetto a t calcolata in t1; al variare di t1, essa è una nuova funzione del tempo, che indicheremo con le usuali notazioni:

 

.

 

D’ora in poi, non useremo più sistematicamente, come abbiamo fatto finora, il segno ̃, per distinguere le formazioni geometriche dagli n-punti; la loro essenza risulterà chiara dal contesto.

In dinamica, la derivata di un punto materiale si chiama quantità di moto”; la quantità di moto riferita all’unità di massa si chiama “velocità(un “punto materiale” è il prodotto di un “punto geometrico” per una massa; quindi, nel descrivere a parole le varie situazioni, noteremo, rispetto all’uso tradizionale, una piccola differenza, la quale non può portare a confusioni se ci si attiene alle definizioni formali esplicitamente date, come sempre si deve fare in qualsiasi teoria scientifica; all’interno del calcolo sopra sviluppato, non si vede alcuna necessità di separare il punto geometrico dalla massa ad esso associata).

La derivata seconda si chiama forza”; e la forza per unità di massa si chiama accelerazione”.

Il bipunto A(t1 )A(t) rappresenta la corda istantanea che sottende l’arco di curva descritta dal punto A durante l’intervallo temporale compreso tra t1 e t (“traiettoria”), chiameremo “spostamento” tale bipunto (usualmente, con questo nome si chiama il vettore del bipunto, cioè: A(t) - A(t1); noi useremo lo stesso nome per entrambi i concetti, senza pericolo di ambiguità, dal momento che la sua essenza matematica viene chiaramente espressa dai simboli, i quali sempre risultano molto più chiari del linguaggio comune, una volta compresone il significato; lo stesso faremo per i termini prima introdotti, cioe: “velocità, accelerazione, quantità di moto, forza”).

Il tripunto A(t)A(t1 )A(t2) rappresenta un triangolo che varia nel tempo. Al limite, per t1e t2 tendenti a t, otterremo il tripunto: , il piano che lo contiene si chiama “piano osculatore”; ovviamente, esso varia al variare di t, la sua giacitura è quella del bivettore .

Il piano del tripunto A T si chiama “piano normale” e la sua giacitura, data dal bivettore T, è normale alla tangente alla curva, cioè alla velocità.

Il  vettore (o, anche, la retta) del bipunto A  si dice binormale”.

L’integrale

 

 

rappresenta la lunghezza dell’arco descritto dal punto, a partire dal punto iniziale Ai , fino al punto finale Af ; ovviamente, .

Invece, l’integrale

è una formazione di secondo grado che rappresenta il limite verso cui tende la somma dei tratti consecutivi della curva: AiA1 + A1A2 + . . . An Af , al crescere indefinito dei punti segnati sulla curva, in modo da far tendere a zero la distanza tra due punti consecutivi. La lunghezza di tale bipunto limite è la lunghezza dello spostamento finale, a partire da quello iniziale, cioe:

 

 .

 

 

 

Trasformazioni lineari

 

 

Le formazioni geometriche sono il paradigma (nel senso antico del ter­mine) di un sistema lineare, per cui l’algebra delle formazioni geometriche si può estendere ad enti di specie più generale, purché per essi si possano stabilire le stesse relazioni formali che abbiamo individuato nelle formazioni geometriche.

Vediamo quali sono tali relazioni formali “elementari” (cioè quelle rela­zioni, a partire dalle quali si possono dedurre tutte le altre, cioè, le propo­sizioni primitive”, distinte in “assiomi” e definizioni”; le relazioni da esse dedotte sono chiamate da Peano proposizioni derivate” o “teore­mi”; però, tali termini hanno, per lui, un valore soltanto relativo, in quanto spesso si può invertire il ruolo di alcune proposizioni primitive con quello di alcune altre proposizioni derivate):

1) Si è dato un significato determinato all’uguaglianza tra enti dello stesso sistema.

2) Si è dato significato alla somma di enti dello stesso sistema che produce un altro ente dello stesso sistema, asserendone la commutatività e l’associati­vità.

3) Si è dato significato alla moltiplicazione di un ente del sistema per un numero, asserendo che il risultato è ancora un ente del sistema e che tale operazione è commutativa.

4) Si è dato significato all’ente “nullo” del sistema (che si può indicare sempre con il simbolo “0”, senza pericolo di ambiguità, non potendosi mai confondere con lo zero dei numeri).

Un qualunque sistema di enti qualsiasi, con le proprietà sopraelencate, lo chiameremo un “sistema lineare”.

Ovviamente, sono sistemi lineari le formazioni geometriche dello stesso grado (comprese quelle di grado zero, come i numeri). Ma non sono sistemi lineari i punti, il segmento orientato tra due punti o l’area orientata di un triangolo, in quanto una loro combinazione lineare potrebbe dare un ente di natura diversa, come un “multivettore” (rispettivamente: un vettore, un bivettore o un trivettore). Tuttavia, i multivettori dello stesso grado formano dei sottosistemi lineari, in quanto una lora combinazione lineare è ancora un multivettore dello stesso grado.

Se n enti Ai di un sistema lineare sono tali che si possano determinare n numeri, ai, non tutti nulli, per cui si abbia:

 

,

 

tali enti si diranno “linearmente dipendenti” tra loro (in caso contrario si diranno “linearmente indipendenti”).

Il numero massimo degli enti di un sistema lineare, che si possono pren­dere tutti indipendenti tra loro, si chiama il “numero delle dimensioni” (o, più semplicemente, la “dimensionalità”) del sistema. Qualunque altro ente del sistema potrà essere rappresentato come una combinazione lineare di n enti indipendenti arbitrariamente scelti, che si chiamano una “base” del sistema:

.

 

La dimensionalità delle formazioni geometriche di primo grado nello spa­zio fisico è 4, nel piano è 3, sulla retta è 2, quella del sottosistema dei vettori è 3 nello spazio, 2 nel piano, 1 sulla retta.

Le formazioni geometriche di secondo grado nello spazio formano un sistema lineare a 6 dimensioni, quelle di grado zero, come i numeri, formano un sistema lineare di dimensionalità 1, ecc.

Per altri tipi di sistemi lineari, la dimensionalità può essere qualunque, a seconda del caso specifico, anche infinita, come nel caso di un sistema lineare costituito da una classe chiusa di funzioni (coll’aggettivo “chiuso” intenderemo, in questo contesto, che una combinazione lineare di enti della classe resta sempre un ente della stessa classe), per la quale basterà intendere la somma di due funzioni come la somma dei valori che esse assumono per un dato valore (del resto qualsiasi) dell’argomento, ecc., in particolare, il sistema dei polinomi di grado n di una variabile è un sistema lineare a n dimensioni.

Chiameremo “operatore”, un qualsiasi ente che applicato ad un ente del sistema produce un altro ente di un altro sistema o, anche, dello stesso sistema.

Tutti i teoremi enunciati per le formazioni geometriche, ovviamente, varranno anche per tutti i sistemi lineari, dal punto di vista delle relazioni formali, indipendentemente dal loro significato fisico, che può essere il più vario; naturalmente, il sistema su cui agisce l’operatore può essere diverso dal sistema in cui è definito il risultato dell’operazione; p. es., l’operatore lineare agisce sui bivettori e dà per risultato un vettore, il viceversa vale per l’operatore lineare T; cioè quello che per l’uno è il dominio, per l’altro ne è il codominio e viceversa.

Particolare attenzione meritano gli operatori lineari, per la loro impor­tanza nelle teorie fisiche, per cui enuncieremo alcune proposizioni rilevanti su di essi, in forma astratta. La forma astratta, appunto per il fatto che astrae dai possibili significati concreti degli enti di cui tratta, per un verso, fa perdere il contatto con l’intuizione fisica, ma, per un altro verso, proprio per la precedente ragione, assume un grado di generalità tale che le sue relazioni formali restano valide in moltissimi casi concreti, i più diversi tra loro.

Le teorie della fisica sono il miglior veicolo per l’assimilazione del pro­cesso dialettico tra astratto e concreto. La confidenza con una sola di queste due forme di rappresentazione della realtà, renderebbe quest’ultima, cioè la realtà, assolutamente monca come un corpo senza testa o una testa senza corpo.

 

D’ora in avanti, useremo le lettere maiuscole per gli operatori lineari, le lettere minuscole in grassetto per gli enti di un qualsiasi sistema e le lettere minuscole in corsivo per i numeri.

Un operatore lineare lo chiameremo, anche, trasformazione”; e, se dominio e codominio coincidono, lo diremo una “sostituzione”.

Dati due sistemi lineari A e B di uguale dimensionalità n, e data una particolare trasformazione, R, che porta un ente a di A in un ente b di B, scriveremo:

 

b = R a.

 

Quando vorremo essere più espliciti scriveremo:

 

[b ¬ a] = [b1, b2, . . . , bn ¬ a1, a2, . . ., an]  ,

 

per dire che la trasformazione R = [b ¬ a], la intendiamo riferita ad una rappresentazione in cui si è scelto un sistema di n enti di A  : a1, . . . , an indipendenti (“base”) per rappresentare ogni ente di A; e una “base”, b1, b2, . . . , bn per rappresentare ogni ente di B.

Che, ovviamente, significa:

 

R a1 = b1 ; . . . ; R an = bn

 

.

 

In particolare, una coordinata di a, nel dato riferimento (cioè nella data base), p. es. c1, si potrà scrivere:

 

c1 = [1, 0, 0, …, 0 ¬ a1, a2, . . ., an]a .

 

Se R = [b ¬ a], scriveremo per la trasformazione inversa: R -1 = [a ¬ b].

Se R è una “sostituzione” porremo, per definizione:

 

(1)                                            .

 

Un elemento di un sistema lineare con una sola dimensione si dice uno “scalare”. Le formazioni geometriche di grado zero sono quindi scalari.

Un elemento di un sistema di sostituzioni tra vettori si dice un tenso­re”. Oggi, si usa tale nome anche per sostituzioni più generali.

Sia a un vettore fissato dello spazio e sia x un vettore arbitrario. La relazione:

 

(2)                                                                    s =  a T x = a × x

 

che dà la componente di x lungo la direzione di a, la possiamo scrivere:

 

(3)                                                                    s = ω1( x )

interpretando ω1 = a T = a × come una trasformazione con dominio i vettori dello spazio e codominio gli scalari che rappresentano le loro componenti lungo a.

Viceversa, se si ha una qualunque trasformazione lineare, ω1, che fa passare da vettori a scalari, è sempre possibile trovare un unico vettore a tale che si possa porre ω1 = a T = a × .

Una qualunque funzione lineare definita sui vettori, come la ω1, si usa chiamare una “1-forma”.

Per quanto detto sopra, è chiaro che l’insieme di tutte le 1-forme definite su un dato sistema di vettori si può sempre considerare come un altro sistema di vettori (non necessariamente identificabile con il primo) e quindi costituisce un altro sistema lineare con la stessa dimensionalità, che si dice il sistema duale del primo.

Modernamente si usa, impropriamente, chiamare vettore un qualsiasi sistema lineare, ed è in questo senso generalizzato che continueremo a usare il termine, adeguandoci all’uso comune; avvertendo, però, che bisogna andare molto cauti nell’adoperare il termine nelle applicazioni concrete della fisica. Lo stesso varrà per i multivettori che ora possono avere un grado qualsiasi, in dipendenza della dimensionalità del sistema di vettori, mediante i quali sono definiti.

Un esempio concreto di 1-forma è il lavoro elementare compiuto da una forza:

 

(4)                                                                    dL = F × dl   .

 

Consideriamo il trivettore, nello spazio fisico,

 

(5)                                                        axy = a T xy  = a × (x Ù y)   ,

 

con a, un vettore fissato, e, x e y, vettori arbitrari.

Dividendo per l’unità di misura stabilita per la grandezza di axy, avremo una funzione scalare s  che dipende linearmente sia da x, sia da y, (“biline­are”) ed è antisimmetrica rispetto a x e y, cioè:

 

(6)                                                                    axy = - ayx  .

 

La (5) si può scrivere:

 

(7)                                                                    s = ω2( x, y )  ,

 

 

avendo indicato con ω2 quell’operatore che produce lo scalare axy, dati due vettori qualsiasi, x e y.

Generalizzando: una qualunque funzione bilineare e antisimmetrica si dice una “2-forma”:

 

(8)                                ω2( a1 x1 + a2 x2 , y ) = a1 ω2( x1, y )  + a2 ω2( x2, y )  .

 

 

(9)                                                        ω2( x, y )  =  - ω2( y, x ) 

 

Un esempio di 2-forma è l’area orientata di un bivettore xy, che possiamo anche scrivere, in termini di coordinate:

 

(10)                              .

 

Nei casi, in cui fisicamente abbia senso la somma tra possibili ω2, definite su di un dato sistema lineare, e si possa scrivere:

 

(11)                                ,

 

allora tale insieme di 2-forme sarà anch’esso un sistema lineare a

 

(12)                                         

 

dimensioni.

Si generalizzano i concetti precedenti e si definiscono le k-forme come: quelle funzioni multilineari di k vettori, totalmente antisimmetriche, cioè tali che scambiando di posto, tra loro, due qualsiasi dei k vettori, la forma cambia di segno, se la permutazione è dispari, o resta dello stesso segno, se la permutazione è pari (cioè, si comporta come un multivettore).

Definendo le combinazioni lineari di k-forme, si viene a formare un siste­ma lineare di dimensionalità  , essendo n la dimensionalità dei vettori su cui la k-forma è definita.

Quindi, a parte la differenza di nomenclatura, formalmente (cioè, indi­pendentemente dal loro significato concreto, da stabilire in ogni singola si­tuazione) le k-forme sono la generalizzazione delle formazioni geometriche a spazi di qualunque dimensionalità, e gli elementi di tali spazi, impropriamen­te chiamati vettori, sono sempre interpretabili come particolari trasforma­zioni.

Infatti, qualsiasi k-forma, in uno spazio a n-dimensioni, si può sempre esprimere, in un sol modo, come una combinazione lineare delle forme di base:

 

(13)                                                     

 

Basterà porre:

 

(14)                                                                  ,

 

 

essendo gli ej, i vettori della base.

 

 

 

Il concetto di campo

 

 

In fisica il concetto di campo è frequentemente usato nei più svariati contesti e spesso, perciò, dal punto di vista epistemologico, sono stati espressi seri dubbi sulla sua effettiva interpretazione fisica in determinate applicazioni concrete, come, p. es., nella teoria elettromagnetica.

Dal punto di vista astratto, cioè puramente formale, invece, la nozione di campo è molto semplice.

Diremo “campo” una qualunque porzione di spazio fisico in ogni punto P del quale è definita univocamente una determinata grandezza fisica G:

 

G = G(P)  .

 

Se G è uno scalare, lo diremo un campo scalare”; se un vettore, un campo vettoriale”; se un tensore, un campo tensoriale”.

Se G è variabile nel tempo, parleremo di “campo variabile”:

 

G = G(P,t)  .

 

Ma, ovviamente, dal punto di vista astratto, si può generalizzare il con­cetto e chiamare campo un qualsiasi elemento G, di un sistema lineare qu­alunque, funzione degli elementi P di un altro sistema lineare qualunque; non si pretende che la funzione che lega G a P sia lineare; ma, spesso, si pretende che G sia funzione continua di P e derivabile a qualsiasi ordine (ma nemme­no queste sono condizioni necessarie per un sistema fisico, usualmente, esse vengono imposte per rendere più semplice la trattazione matematica).

Facciamo alcuni esempi di applicazione del concetto di campo nella fisica, dove alla stessa struttura matematica (e, spesso, anche per spiegare lo stesso fenomeno, a causa di diversi paradigmi filosofici) vengono attribuiti significati del tutto diversi.

Prendiamo, ad esempio, un corpo e consideriamone, idealmente, una sua porzione qualsiasi, anche interna al corpo stesso e sia DV il volume dello spazio occupato da tale porzione e sia D m la sua massa.

Si definisca la densità media di tale porzione con il rapporto:

 

(15)                                                                  .

 

Sia P un punto dello spazio (considerato come elemento di una forma­zione geometrica di primo grado), interno a tale porzione del corpo e im­maginiamo di prendere porzioni sempre più piccole del corpo, che comunque contengano sempre il punto P al suo interno. Se immaginiamo la materia co­me distribuita continuamente all’interno del corpo, al limite per DV tendente a zero potremo scrivere:

 

(16)                                                                  .

 

Se, invece, pensiamo che la materia sia discontinua, cioè fatta di parti­celle elementari inframmezzate da spazio vuoto, allora non ha molto senso la nozione di derivata, nella più usuale definizione, (naturalmente, se ne può ge­neralizzare il concetto fino a comprendere anche situazioni totalmente discon­tinue come questa) ma, per il momento, ci accontenteremo di un’approssi­mazione, quasi sempre ottima nelle applicazioni pratiche, che ci permette di utilizzare l’usuale calcolo differenziale e integrale.

Cioè, si immagina di avere un DV, che sia sufficientemente piccolo da consentire di poter trascurare infinitesimi di ordine superiore nello sviluppo in serie della densità, in funzione di uno spostamento all’interno di DV; e, nello stesso tempo, sufficientemente grande da contenere un numero enorme di particelle elementari, in modo che si possano trascurare le fiuttuazioni sta­tistiche, e così ottenere, per la densità, una funzione ρ(P), sufficientemente regolare che possa rappresentare la situazione reale con buona approssima­zione.

Questo genere di approssimazione è la norma nelle applicazioni fisiche della matematica, ma spesso in fisica ci si dimentica che qualcosa che è sot­tintesa non è per niente scomparsa!

Tale distribuzione di densità, ovviamente, corrisponde ad un campo sca­lare.

Il valore della densità in un punto P potrebbe variare anche nel tempo, avremo un campo scalare variabile:

 

ρ = ρ(P,t) ;

 

l’esempio classico è quello di un fluido in movimento.

Supponiamo di essere in una tale situazione, che con buona approssima­zione è realizzata da una corrente d’acqua di portata costante che si muova con velocità non molto elevata in una condotta che possiamo pensare fatta di vetro in modo da vedere cosa accade alla corrente; anzi, a tale scopo, immaginiamo di immettere in un punto qualunque della corrente, con opportuni imbutini, un filetto di acqua colorata (p. es., inchiostro), o un granello di permanganato potassico che sciogliendosi rapidamente genera dei filetti fluidi colorati facilmente visibili anche ad occhio nudo.

Finché tali filetti non si saranno dispersi, possiamo osservare quelle che si chiamano le “linee di corrente” o “linee di flusso”; un gruppo compatto di tali linee ci dà l’idea di quello che in effetti si chiama un “tubo di flusso”, che è l’insieme di tutte linee di flusso che attraversano ogni punto di una qualunque sezione ideale che tagli la corrente.

In un fluido stazionario tali linee restano sempre identiche col passare del tempo. La velocità con la quale si propaga il filetto colorato si suppone essere la stessa con la quale si muove ogni elemento del fluido. Essa è definita in ogni punto del fluido da un vettore v che varia da punto a punto ma che, nel caso stazionario, resta sempre lo stesso nello stesso punto del fluido.

Questo è un esempio di “campo vettoriale”:

 

v  =  v(P)  .

 

Il vettore v è in ogni punto tangente alla linea di flusso passante per quel punto.

Nel caso non stazionario sarà anche funzione del tempo:

 

v = v(P,t)  .

 

Consideriamo ora una porzione elementare di volume di un solido elasti­co e immaginiamo di sottoporlo ad uno sforzo di tensione o di pressione, esso si allungherà o si accorcerà per effetto dello sforzo. Per semplicità, suppo­niamo che l’elemento di volume che stiamo considerando abbia forma cubica e prendiamo un sistema di riferimento con origine in uno dei vertici del cubo e con assi coordinati lungo gli spigoli che si dipartono da tale vertice.

Supponiamo di applicare uno sforzo all’elemento di volume considera­to, sia dfx la sua componente lungo la direzione x e che, quindi, si esercita normalmente alle due facce parallele al piano yz; e, analogamente, definiamo le componenti dfy, e dfz (si è soliti considerare la forza all’unità di superfice normale in un intorno del punto considerato). Siano dx, dy, dz gli allunga­menti (positivi o negativi) che subisce l’elemento di volume per effetto dello sforzo complessivo: df = dfxi + dfyj + dfzk .

In generale si ha:

 

dx = a11dfx + a12dfy + a13dfz

 

dy = a21dfx + a22dfy + a23dfz

 

dz = a31dfx + a32dfy + a33dfz

 

Dove gli aij sono dei coefficienti che possono essere funzioni del punto intorno al quale abbiamo scelto l’elemento infinitesimo di volume ed, even­tualmente, anche del tempo, ma non dipendono dall’intensità dello sforzo applicato o, meglio, dalle variazioni degli sforzi, dfx , dfy , dfz , (proprio me­diante tali condizioni viene data la definizione stessa di solido elastico; in realtà si possono avere delle piccole non linearità per sforzi relativamente grandi). Per ragioni fisiche, tali nove coefficienti non sono tutti indipendenti tra loro, ma qui la cosa è per noi irrilevante.

Le tre relazioni, che abbiamo scritto sopra, le possiamo anche scrivere in forma vettoriale, ponendo dl = dxi + dyj + dzk  :

 

(17)                                                                  dl = A df  ,

 

dove  A è una trasformazione lineare da vettori a vettori e, quindi un tensore.

Questo è un esempio di campo tensoriale, anzi il nome tensore deriva dalle tensioni interne con le quali il solido reagisce agli sforzi esterni per equilibrarli e che si ipotizza siano causate dalle forze intermolecolari.

Occupiamoci, ora, più particolarmente, dei campi vettoriali, i quali sono di grande rilevanza per lo studio dell’elettromagnetismo.

Qui avremo a che fare con un concetto di campo che, pur avendo sempre la stessa definizione formale, invece, dal punto di vista della fisica, risulta concettualmente diverso dall’idea che ci siamo andati formando attraverso gli esempi concreti di natura idrodinamica che abbiamo dato finora.

Consideriamo una carica elettrica (ma lo stesso discorso si può ripe­tere, senza rilevanti modifiche, per una massa magnetica o per una massa gravitazionale).

Supponiamola fissa in un certo punto O di un dato riferimento.

Se si pone un’altra carica elettrica in un punto P, a una certa distanza dalla prima, fra le due si esercita una forza data dalla:

 

(18)                                                      ;

 

per una data variazione della carica q si ha:

 

(19)                                                          dF = Edq  ,

 

con

 

(20)                             

 

Quindi il vettore E, definito su tutti i punti P dello spazio, dal punto di vista formale, costituisce un campo vettoriale, chiamato appunto “campo elettrostatico”.

Ma c’è una sostanziale differenza, dal punto di vista fisico, con il campo delle velocità che è definito nei punti di un fluido; non perché si tratta di due grandezze fisiche diverse, ché questo sarebbe irrilevante in questo contesto, ma perché, nel caso del fluido, l’esistenza del campo in un punto del fluido stesso è sempre definito, in quanto il campo è creato dal movimento della materia fluida, la quale, a sua volta, costituisce il campo scalare a partire dal quale è definito il campo delle velocità; mentre, nel caso di un campo di forza con interazione a distanza, la forza sarà effettivamente agente solo in presenza di una carica di prova, e solo in questo caso potrà avere senso parlare di campo di forza in un punto, essendo questo zero in tutti gli altri punti dello spazio; e, d’altra parte, la presenza della stessa carica di prova verrebbe, indirettamente, a modificare profondamente il campo delle forze che agisce sul punto P, per effetto dell’influenza che essa esercita sulle cariche che creano il campo.

Naturalmente la quantità matematica è perfettamente definita e nien­te ci impedisce di usarla coerentemente nella teoria per determinare altre grandezze fisiche misurabili, solo non possiamo, a partire dalla sua defini­zione formale, misurare direttamente un campo perché, operativamente, noi possiamo misurare solo forze; anche se, nel caso che la carica di prova sia sufficientemente piccola da non provocare variazioni sensibili, si potrebbe effettuare una verifica diretta.

Per quanto detto, le formule saranno le stesse sia che vengano interpre­tate secondo il modello idrodinamico, sia che lo siano secondo il modello delle forze agenti a distanza, ma il loro significato fisico potrebbe risultare profon­damente diverso e potrebbe condurre a rilevanti errori interpretativi, se non si fa attenzione alla sostanziale differenza concettuale che abbiamo messo in luce. Tali errori non sono infrequenti nelle moderne speculazioni teoriche.

Quello che abbiamo detto risulta molto più rilevante nel caso dei campi elettrici e magnetici, di quanto non sia per i campi gravitazionali, a causa del fenomeno di induzione, dal momento che non è, in generale, trascurabile il campo creato dalle cariche di induzione che si vengono ad aggiungere alla carica originale Q che crea il campo.

Perciò appare assolutamente illusoria, come osservava Boltzmann, la credenza che si possa costruire una teoria fisica a partire dalle leggi empiriche.

Si usa chiamare “intensità del campo”, il vettore del campo.

Se la carica Q, che crea il campo, è in movimento, allora il campo sarà, in generale, dipendente dal tempo.

Sono importanti per il seguito gli operatori differenziali introdotti da Hamilton.

Intanto introduciamo il concetto di “differenziale” nella forma genera­lizzata, usata dal Peano, valida per enti lineari qualsiasi:

Sia x un ente di un qualsiasi sistema lineare S, e sia y = f(x), una sua funzione, il cui risultato y sia un ente di un altro qualsiasi sistema lineare R.

Se x′ è un ente qualsiasi di S, poniamo, per definizione:

 

(21)                                          .

 

L’ente , ovviamente, appartiene al sistema R ed è funzione di x e di x′ e, nell’ipotesi che il limite indicato nella (21) esista, si chiama differenziale della funzione f(x) calcolato in x”.

L’ente x si dice “differenziale della variabile indipendente x”.

Se x e x′ sono ben determinati, scriveremo semplicemente: df .

Facciamo degli esempi semplici:

Supponiamo che S ed R siano entrambi campi scalari funzioni di un parametro t, si avra:

 

(22)                                          ,

 

 

(23)                                             .

 

Sia S un sistema lineare ad m dimensioni con i vettori di base (e1,... ,em), ed R un sistema lineare ad n dimensioni con i vettori di base (b1,... ,bn) e sia y = f (x).

 

Si abbia:

 

x  = x1e1 + ... + xmem

(24)                                          x = x1e1 + ... + xmem

                                                y  = y1b1 + ... + ynbn

 

si avra:

 

(25)                  .

 

Oggi è più comune la seguente scrittura:

 

(26)                                                      .

 

Nell’operazione precedente  è un operatore lineare sul sistema S:

 

(27)                                          .

 

In termini di coordinate, è rappresentato da una matrice rettangolare n ´ m.

Se n = m, il suo determinante, indicato con:

 

(28)                                                      J   ,

si usa chiamare jacobiano”.

Sia f(P) una funzione scalare del punto P di uno spazio astratto a n dimensioni, sia u un vettore differenza di due punti di detto spazio; essendo operatore lineare, esisterà sempre, per quanto detto sui sistemi lineari, un vettore nello spazio duale,16 che qui indicheremo con a(P), eventualmente dipendente da P, ma non da u, tale che si possa porre:

 

(29)                                                      a T u = a × u  .

 

Il vettore a si dice il “gradiente” di f calcolato in P (nella letteratura più antica veniva chiamato, “parametro differenziale”), spesso si indica, seguendo Hamilton, con Ñ:

 

(30)                                                      .

dove si è posto: r = P - O, essendo O un punto arbitrario.

Notiamo che l’operazione  a × = a T è un operatore lineare sui vettori u, e non un vettore, mentre Ñ è un operatore lineare sulle funzioni scalari di punto, che le trasforma in vettori, quindi è un “operatore vet­toriale”, nel senso che si può immaginare come la somma di tre derivazioni lungo tre direzioni indipendenti, per cui si ha:

 

(31)                                          Ñ (fg) = f  Ñ g  + g Ñ f  .

 

A voler essere coerenti, si dovrebbe scrivere

 

(32)                                                      = Ñ f  T = Ñ f  ×   ;

ma l’identificazione tra due oggetti algebricamente diversi, che tuttavia si riferiscono biunivocamente allo stesso concetto geometrico o fisico, non ne­cessariamente porta a inconvenienti semantici; purché si tenga sempre ben presente la loro diversità formale, nelle manipolazioni algebriche; le quali, fatte meccanicamente, potrebbero portare a incongruenze, con ovvie conse­guenze anche sul piano semantico.

Se fissiamo un sistema di coordinate cartesiane ortogonali, con origine O, e poniamo r = P - O, si può scrivere:

 

(33)                                          ,

 

come si verifica facilmente, essendo  un operatore lineare sul sistema lineare delle funzioni scalari; tuttavia, ricordiamo che il gradiente è un ente assoluto, cioe indipendente dal sistema di coordinate scelto, perciò si è soliti dire che e invariante per arbitrarie trasformazioni di coordinate.

Naturalmente, il gradiente può esistere solo se la funzione scalare è de­rivabile nel punto considerato e in qualsiasi direzione.

Per un circuito chiuso si ha:

 

(34)                                                      .

 

 

Viceversa, se in una campo vettoriale  v (r) , per qualunque circuito si ha:

 

(35)                                                      ,

 

allora, necessariamente, esiste una funzione scalare j (r), definita a meno di una costante arbitraria, che si dice “potenziale” e tale che si abbia:

 

(36)                                                      .

 

Un particolare sviluppo in serie per un campo scalare, in termini del­l’operatoreÑ deriva dal fatto che l’operatore gode di tutte le proprietà delle derivate rispetto a una variabile numerica, e quindi possiamo sviluppare in serie di Taylor una funzione scalare e scrivere:

 

(37)                  ;

 

che, per la (1), con la quale abbiamo definito l’operatore esponenziale, pos­siamo scrivere:

 

(38)                                                      .

 

In un campo vettoriale arbitrario, v (r), consideriamo l’integrale lungo una linea chiusa, l, supponendo che sia ben definito il valore di tale integrale di linea:

 

(39)                                                      ,

 

 

essendo dl un vettore tangente alla linea nel punto P = O + r e O un’origine arbitraria; la quantità C si chiama la circuitazione del campo vettoriale v lungo la linea chiusa l.

Il valore di dC per un circuito chiuso elementare (preso intorno ad un punto P = O + r) che tuttavia indicheremo semplicemente con dl, è:

 

(40)                                                      ,

 

ed è una funzione scalare di campo.

 

 

***

 

 

Sia v (P) un arbitrario campo vettoriale.

Si chiama “flusso” elementare del vettore v in un punto P dello spazio, il trivettore:

 

(41)                                                      dF = dS v T n = v(P) × dS   ,

 

 

essendo n un versore normale all’elemento di superficie dS (con verso dato dalla solita regola di orientazione) e avendo posto per definizione dS = n dS .

Quindi possiamo anche scrivere:

 

(42)                              dF = v × dS = | v | | dS | cosq = vn | dS | = | v | dSn  ,

 

essendo q, l’angolo tra le direzioni di v e dS, vn  la componente normale alla superficie dS e dSn  l’elemento di superficie normale al campo.

Per una superficie arbitraria S, il flusso del campo attraverso di essa, è:

 

(43)                                                        .

 

Se v è il vettore velocità di campo, in un punto di un fluido, per una superficie elementare si ha:

 

(44)                                                        ;

 

quindi, esso rappresenta, in questo caso concreto, la “portata”, cioè, il vo­lume di fluido che attraversa la superficie dS, nell’unità di tempo.

Per una superficie chiusa si conviene di assegnare il segno positivo a un flusso uscente e negativo al flusso entrante.

Se all’interno di una superficie chiusa S non si hanno “sorgenti” o “pozzi” per il flusso o se l’intensità che esce dalle sorgenti è pari all’intensità assorbita dai pozzi, allora il flusso totale uscente da quel volume (conside­rato algebricamente) deve essere nullo perché il volume del fluido entrante è sempre uguale e opposto a quello uscente. Tale terminologia idrodinamica viene usata anche nelle altre interpretazioni del campo vettoriale, anche in quei casi in cui non è possibile immaginare alcun fluido che scorra.

Se il flusso totale uscente è diverso da zero, allora necessariamente de­vono esistere delle sorgenti positive o negative (pozzi) in qualche punto o in tutti i punti del dato volume, tali che la loro somma algebrica non sia nulla (useremo nel seguito il termine “sorgente”, anche per i pozzi, il segno dell’intensità di sorgente ci dirà se si tratta dell’un caso o dell’altro).

Si chiama “divergenza” del campo vettoriale v, nel punto P, il flusso che attraversa una superficie chiusa e riferito all’unità di volume; dove la superficie racchiude un volume sufficientemente piccolo (sempre ai fini della possibilità di poter utilizzare il calcolo differenziale) preso nell’intorno del punto dato:

 

(45)                                                        ,

dove:

 

(46)                                                      ,

 

 

essendo dS la superficie chiusa che delimita il volume elementare dV, il quale comprende il punto = O + r, con O punto origine arbitrario e dA una su­perficie elementare aperta (notiamo che stiamo usando gli aggettivi “aperto” e “chiuso” nel senso fisico e non nel senso in cui la distinzione viene usata nella teoria degli insiemi).

Si dimostra:

 

(47)                                                      ,

 

essendo V un volume arbitrario, dove in ogni punto di esso è definito l’opera­tore Ñ, e S è la superficie chiusa che lo contorna e in ogni punto della quale è definito il vettore v.

Questa importante uguaglianza, che trasforma un integrale di volume in un integrale di superficie, esteso a tutta la superficie che circonda il dato volume, è nota come la relazione di Gauss”.

Ricordiamo che la divergenza, come il gradiente, è un ente assoluto, cioe indipendente dal sistema di coordinate scelto e quindi invariante per arbitrarie trasformazioni di coordinate.

Consideriamo un esempio, estremamente importante per le nostre suc­cessive applicazioni fisiche.

Supponiamo di voler verificare la (47) in un caso particolarmente sempli­ce, e calcoliamo prima la divergenza di un campo vettoriale della forma

 

(i)                                                         E = k r n r

e proponiamoci, successivamente, di trovare il valore di n per cui la divergenza risulti identicamente nulla.

Usando una nota identità, avremo:

 

div (k r n r) = k (r n div r  +  r × grad r n ) =

 

(ii)                         = k (3r n +n r n-1 r × grad r) = k (3r n +n r × r r n-2) = k (3 + n) r n

 

quindi, la divergenza è sempre ben definita, con l’esclusione (nel caso che sia n < 0) del punto = 0; escludendo tale punto, la divergenza è identicamente nulla per n = -3, cioè si ha:

 

(iii)                                                                  

 

 

Verifichiamo, ora, la relazione di Gauss per una sfera di raggio r = R con un campo della forma (i), per n ¹ - 3.

Il primo membro della (47), con E al posto di v, per il risultato (ii), vale:

 

(iv)                              

 

(con il segno 0+ intendiamo escludere dall’integrazione il punto r = 0).

Per n = -3, il primo membro della (47), per il risultato (iii), è nullo.

Il secondo membro della (47), vale (ricordando la definizione di angolo solido: ):

(v)                                ,

 

la precedente relazione vale qualunque sia il valore di n.

Abbiamo verificato l’uguaglianza dei due membri della (47), con questa forma particolare di campo, per qualunque valore di n diverso da -3; mentre l’uguaglianza sembra non valere per n = -3.

Ma ricordiamo che nell’integrazione di volume avevamo escluso un in­torno dell’origine, ancorché arbitrariamente piccolo; punto origine che non interviene, invece, nell’integrale di superficie.

Per n > -3 il flusso, come dato dalla (v), tende a zero all’origine e quindi il punto origine non dà alcun contributo al flusso; per n < -3, all’origine si ha una sorgente infinita, per cui il flusso calcolato includendo l’origine diver­gerebbe anch’esso; per n = -3 il flusso, includendo l’origine è costantemente uguale a 4pk, il che significa che l’origine è l’unica sorgente del campo, mentre negli altri casi dobbiamo immaginare delle sorgenti continuamente distribuite nel campo.

Se ne deve concludere che:

“la legge dell’inverso del quadrato delle distanze è la sola legge compati­bile con l’idea di particella”.

Quindi, il valore n = -3, che sopra abbiamo stabilito quale condizione unica per avere una divergenza dappertutto nulla, è solo una condizione ne­cessaria ma non sufficiente. La condizione diventa anche sufficiente quando, all’interno del volume considerato, non vi siano sorgenti per il campo o le sorgenti siano tali che la somma algebrica delle loro intensità sia nulla.

Se, come si usa fare nelle applicazioni fisiche, si definisce la divergenza con la (45), ne segue che bisogna andare cauti nell’identificare la divergenza di un vettore con il prodotto scalare dell’operatore nabla per il vettore di campo, in quanto i domini di integrazione dei due integrali sono diversi.

Se in ogni punto del campo si ha div v = 0, allora si dice che il campo è “solenoidale”, ovvero “conservativo per il flusso”.

Una formula analoga alla relazione di Gauss si può dimostrare per la circuitazione, se introduciamo il vettore:

(48)                                                      rot v = Ñ Ù v   .

 

Considerando la circuitazione di v lungo un circuito chiuso:

 

(49)                                                      ,

 

con un po’ di algebra si può scrivere:

 

(50)                                                      dC = rot v × dS  ,

 

a partire dalla quale si arriva ad un’altra importante uguaglianza, valida per qualunque campo vettoriale, nota come “relazione di Stokes”:

 

(51)                                                      .

 

Cioè il flusso del rotore di v attraverso una superficie S è uguale alla circuitazione di v lungo la linea chiusa l, che rappresenta il contorno della superficie S; in altre parole, il flusso del rotore dipende solo dal contorno della superficie e non dipende, invece, dalla forma o dall’estensione della superficie stessa.

Con tale relazione un integrale di superficie può essere calcolato per mezzo di un integrale di linea e viceversa.

Anche qui bisogna considerare le possibili eccezioni dovute alla diversa definizione dei domini di integrazione.

Se, in tutti i punti del campo, si ha rot v (r) = 0, allora il campo si dice “irrotazionale”.

Nel caso che il campo vettoriale sia un campo di forza la condizione di irrotazionalità viene a significare che il lavoro compiuto lungo una linea chiusa è nullo e che quindi il campo è conservativo per il lavoro e ciò implica l’esistenza di una funzione potenziale.

Nel caso che il campo vettoriale rappresenti il campo delle velocità in un fluido, in condizioni stazionarie di moto, la condizione di irrotazionalità significherà l’assenza di vortici.

Ma, in ogni caso, la condizione rot v (r) = 0 implica l’esistenza di un campo scalare, detto, appunto, “potenziale scalarej (r), tale che:

 

(52)                                                      grad j (r) = v (r)  .

 

Analogamente, la condizione div v (r) = 0 implica l’esistenza di un po­tenziale vettore”, definito a meno del gradiente di una funzione scalare; questo deriva dal fatto che, necessariamente, per qualunque campo vetto­riale v (r), si ha:

 

(53)                                          div rot v (r) = Ñ × ÑÙ v (r) = 0  ,

 

(purché gli operatori siano definiti nei punti considerati) e per qualunque funzione scalare j :

 

(54)                                          rot grad j  = Ñ Ù Ñ j  = 0.

 

 

 

Applicazioni alla meccanica razionale

 

Chiariamo che con il termine “Meccanica Razionale” intendiamo la mec­canica di Newton nell’interpretazione di d’Alembert (secondo noi la più ade­rente allo spirito e alla lettera dei “Principia”di Newton), diametralmen­te opposta a quella successivamente affermatasi sulle orme di Eulero e di Lagrange.

La prima è una scienza che non fonda i suoi principi matematici sulle leggi empiriche ma che, al contrario, si propone di spiegare le leggi empiriche a partire dagli “elementi” razionalmente definiti da opportune convenzioni linguistiche basate su modelli semplici e verificabili.

Pensiamo che il calcolo geometrico di Peano sia lo strumento più adatto per una tale concezione della meccanica.

Consideriamo un insieme di sistemi di forze (cioè di formazioni di secon­do grado, nel seguito, l’abbrevieremo con F2 e simili abbreviazioni useremo per le altre formazioni); indicando con il segno = l’equivalenza meccanica di due sistemi di forze, con il segno + la sovrapposizione meccanica di due sistemi, con il segno 0 un sistema in equilibrio meccanico, i sistemi di forze costituiranno un sistema lineare. Il numero delle dimensioni di tale sistema (cioè il numero dei parametri necessari e sufficienti per descriverlo completa­mente) si dice “numero dei gradi di libertà del sistema”; p. es., per un corpo rigido esso vale 6.

Un sistema di punti materiali, ovviamente, non è un sistema lineare, dal momento che la sua derivata è un vettore e non più un punto materiale, anche se i vettori sono un sottosistema di un sistema lineare costituito dalle F1.

Se  è un sistema di punti materiali, converrà considerare la F2:

 

 ,

 

essendo O un punto arbitrario.

La meccanica razionale non è altro che la teoria matematica che collega tra loro tali due sistemi di F2 (forze e bipunti). Come già detto, il calcolo geometrico, come sviluppato dal Peano, è, a nostro avviso, la più semplice e, nello stesso tempo, la più completa di tali teorie matematiche; per di più, ha il vantaggio di restare ancorato alle effettive operazioni fisiche che si possono compiere sui sistemi fisici. Anzi, per le stabilite corrispondenze fra simboli ed enti fisici, non ci sarebbe altro da aggiungere, se non quello di risolvere determinati problemi concreti.

Dal punto di vista della matematica, nulla vieta di considerare un siste­ma di punti materiali come variabile (p. es., nel tempo); ma, dal punto di vista della fisica, è necessario che ci si possa accorgere della loro variabilità.

Per accorgersene bisognerà essere in grado di misurare certi parametri numerici che rappresentino determinati rapporti tra grandezze della stessa specie.

Un punto materiale, oltre alla massa che supponiamo di sapere come misurare, non ha altri parametri numerici. Noi possiamo misurare solo le distanze di esso da altri punti. Empiricamente ci accorgiamo che, per individuarlo uni­vocamente (in un determinato istante), occorrono quattro parametri (massa compresa). Quindi dobbiamo scegliere quattro formazioni geometriche ar­bitrarie per individuarlo. L’algebra che ne viene fuori, qualunque sia il tipo di riferimento che vogliamo scegliere, non sarà diversa. Ma, per certi proble­mi particolari, alcune scelte possono risultare più adeguate di altre.

Intenderemo, per riferimento, un ben determinato sistema fisico. Se si immagina che tale sistema di riferimento sia fissato una volta per tutte, non sarà necessario menzionarlo; ma questo non significa che sia scomparso.

Ma, ripetiamolo, per tirare fuori conclusioni di ordine generale, non sa­rà necessario usare le coordinate, tranne che per qualche esempio concreto; infatti, tutto quello che si può dire in generale sugli enti fisici, lo si può di­re senza farne uso; le eventuali diversità, che si dovessero riscontrare nelle formule che descrivono la stessa fisica, possono solo dipendere dalla loro par­ticolare rappresentazione in un dato sistema di coordinate, e non possono essere diversità degli enti fisici; in un linguaggio assoluto tali diversità devo­no scomparire; per cui perdono di significato termini quali: interpretazione attiva e passiva di una trasformazione, quantità covarianti e controvarianti, e ogni altro termine legato alla particolare rappresentazione.

Le esposizioni della meccanica classica, quasi sempre, cominciano col supporre che il sistema di riferimento debba essere inerziale; ma poi si tro­vano in difficoltà nel cercare di stabilire che cosa sia un sistema inerziale (naturalmente, questo vale anche per la teoria della relatività ristretta).

Qualcuno dice che è inerziale un sistema di riferimento in cui valgano le leggi di Newton, ma poi si aggiunge che tali leggi valgono solo in un sistema inerziale e, così, si chiude il circolo!, a parte il fatto che, con la locuzione “leggi di Newton”, si intendono cose assolutamente lontane dalle idee di Newton. Infatti si intendono: la relazione F = ma , e il principio di azione e reazione inteso nell’accezione “forte”, cioè che le forze tra due punti materiali siano vettori uguali ed opposti e, in più, giacciano sulla stessa linea d’azione individuata dalla retta che congiunge i due punti materiali. Vedremo più avanti che cosa implicano tali richieste.

Altri dicono che un sistema è inerziale se si muove di moto traslatorio uniforme rispetto al sistema delle stelle fisse; ma, siccome tale sistema non e certamente inerziale, si aggiunge che lo è solo approssimativamente. Quanto buona sia tale approssimazione e per quali sistemi di forze debba ritenersi valida, nessuno può essere in grado di dirlo.

Per tale ragione, per fondare la meccanica di Newton, proveremo a non nominare i sistemi inerziali; del resto Newton ha fondato la sua teoria senza che mai gli balenasse l’idea che tali inconoscibili enti potessero servire a qualcosa, visto che mai li menziona! Noi, nell’incertezza, proveremo a vedere fino a che punto si può andare avanti senza nominarli.

Ricordiamo che Newton non parla mai di punti materiali ma di corpi. Il punto materiale è stato inventato solo molto tempo dopo (qualcuno ne attribuisce l’introduzione a Eulero anche se lo stesso parla ancora di corpi) come idealizzazione di un corpo, nel caso in cui i suoi gradi di libertà interni non influiscano sul fenomeno in istudio. In tal caso si può sostituire il corpo con il suo baricentro; anche se spesso non può essere esattamente determinato sperimentalmente.

Se l’effetto delle forze interne non puo essere trascurato, si può pensare di suddividere, idealmente, il corpo in parti opportune, in modo tale che per ognuna di tali parti, in relazione al fenomeno studiato, si possano trascurare i gradi di libertà interni. Per tali parti useremo il nome di “particelle”.

Dal momento che le forze agiscono tra punti (nel senso sopraspecificato), esse devono essere indicate da bipunti e non da vettori.

Un’ultima avvertenza è necessaria: la variabilità nel tempo deve inten­dersi rispetto a un tempo omogeneo locale.

Quindi quella parte della fisica che può essere descritta con dei numeri si riferisce sempre ad un dato sistema di riferimento (fisicamente determinato) che sottintende anche il modo di misurare il tempo, almeno localmente, oltre alle unità di lunghezza di area e di volume.

Per collegare gli esperimenti eseguiti all’interno di un dato riferimento con gli esperimenti di altri osservatori, che procedono alle loro osservazioni relativamente ad altri riferimenti, bisognerà fare altre ipotesi; da verificare, se possibile, sperimentalmente. Ma, in ogni caso, la teoria che li collega non può avere alcuna influenza sulla fisica di un qualsiasi osservatore; al massi­mo, costui potrebbe preferire una matematica piuttosto che un’altra, quando risultassero rilevanti gli scambi di esperienze tra tali ipotetici osservatori.

 

***

 

Sia , una F1 che rappresenti un sistema di particelle che, per brevità, chiameremo “corpo”; indicheremo con la sua massa, con il suo baricentro. Supporremo, per il momento, che le mi siano costanti nel tempo, ma che le distanze relative tra le particelle del corpo siano variabili nel tempo come localmente definito.

Consideriamo il bipunto b = OB, che possiamo anche scrivere b = O (B - O) = O r, e che chiameremo: la “linea istantanea del baricentro, rispetto ad O”; diremo che r è il vettore di tale linea o “raggio vettore”.

Più in generale, diremo che bi = OBi è la linea di Bi  rispetto ad O e che ri = Bi - O è il suo raggio vettore.

Chiameremo:

Bi (t) Bi (t + Dt) la “linea dello spostamento di Bi (t) nel tempo Dt”; il suo vettore lo chiameremo “spostamento”.

Per Dt sufficientemente piccolo si ha:

 

 ;

 

è la “velocità della particella Bi”.

La F2:  rappresenta in modo assoluto, cioè indipen­dentemente dal riferimento, la somma delle quantità di moto delle singole particelle. Essa si può scrivere, se O è un punto arbitrario:

 

TOp +Tc  .

 

Chiameremo p la “quantità di moto totale” del corpo (per definizione èun ente assoluto, essa diventa una quantità quando si assegnino le opportune unità di misura). E c è il “momento angolare totale” del corpo relativamente al punto O.

Consideriamo la F2 (derivata della precedente):  (“siste­ma delle forze” che agiscono sulle singole particelle del corpo), che possiamo anche scrivere:

 

TOf +T  ,

 

f è la “risultante” delle forze relative che agiscono sul corpo e  il “momento delle forze” relativo al punto O.

Anche se f = 0, il corpo può avere, complessivamente, un moto accelera­to intorno al baricentro, oltre a un moto traslatorio uniforme del baricentro, che si aggiunge (algebricamente) a tutte le particelle (in questo caso   sarà un bivettore, cioe una coppia). Ovviamente, un moto intorno al baricentro può aversi anche quando f = 0 e p = 0; nel caso particolare di un corpo rigido, si tratterebbe di un moto rotatorio uniforme (spin).

Notiamo che la relazione che abbiamo scritto sopra è un’identità al­gebrica e vale qualunque sia il punto O; in particolare, vale se al posto di O mettiamo il baricentro del corpo B, quindi:

 

T  ,

 

essendo, , la derivata temporale dell’eventuale “momento angolare intrinse­co” (brevemente: “spin”). Quindi:

 

Of +T  = Bf + T  .

 

O  anche:

 

(ricordiamo che r è la coordinata del baricentro del corpo rispetto ad O).

Dalle precedenti definizioni si può concludere:

“Per qualunque osservatore la forza f (in quanto ente assoluto) resterà la stessa anche se per i vari osservatori potrà cambiare la loro classificazione tra “forze effettive” e “forze di inerzia”.

Ma questo non significa che non debbano cambiare i parametri con i quali i vari osservatori individuano tale forza, ognuno nel proprio riferimento.

Per quanto riguarda il momento delle forze, l’osservatore baricentrico può dire che è assoluto, in quanto dipende dalle forze che si esercitano sulle particelle del corpo; particelle che gli appaiono girargli attorno con diverse velocità e accelerazioni, ed è giusto uguale a ; e potrà dire che gli altri osservatori ne vedono uno diverso solo a causa della loro diversa posizione.

Se un qualunque osservatore si convince che non ha alcun senso la “quiete assoluta”, perché non verificabile empiricamente, potrà sempre assumere, in ogni caso, come leggi universali del moto, l’espressione:

 = Of +T  + T r Ù f ,

 

e non si preoccuperà di sapere se la forza e la coppia che misura siano effettive o apparenti (d’inerzia).

La relazione che abbiamo scritto vale, ovviamente, anche per una sola particella (un corpo piccolo!), qualunque sia l’osservatore O e qualunque sia il suo riferimento, purché le forze siano quelle da lui misurate e non quelle da lui ipotizzate, eventualmente potra aversi = 0, se la “particella” è un corpo effettivamente “piccolo” in base alle varie misure sperimentali, indipendentemente dalla sua estensione geometrica.

E dirà che:

è il sistema “assoluto” di forze che agisce sul corpo; f ne è la sua risultante; s è lo spin del corpo, essendone  la sua derivata temporale (coppia di forze) che dipende dalla posizione relativa di tutte le altre particelle del corpo; r Ù p è il momento angolare del corpo relativo ad O; e la somma di questi ultimi due termini, c, è il momento angolare totale del corpo rispetto ad O”.

Supponiamo che si abbia = 0; perché ciò si verifichi è necessario che siano separatamente nulli il vettore f e il bivettore T.

Esaminiamo il caso più semplice in cui l’universo sia costituito solo da due particelle mA, nB.

Si avra:

cioe:

“le forze reciproche sono uguali e contrarie ed agiscono nella retta diAB”.

 

Anche nel caso di molte particelle vale la conclusione che se = 0 deve valere il principio di azione e reazione nell’accezione forte, per cui possiamo identificare  con il sistema di forze esterne al corpo; e se = 0 diremo che il corpo è isolato. Se ne deduce che:

“solo un sistema di assi, fisso rispetto al baricentro di un sistema isolato, può essere inerziale”

e quindi, rigorosamente, solo lo può essere un sistema di riferimento fisso rispetto al baricentro dell’universo ammesso che questo sia finito.

Formalmente:

“In un sistema isolato le forze, di qualunque natura esse siano, agisco­no sempre lungo le rette che congiungono le particelle, dipendono solo dalla distanza relativa tra le due particelle e le reciproche forze sono sempre uguali e contrarie”.

Possiamo asserire qualcosa, senza ricorrere ad alcuna legge empirica, come del resto abbiamo fatto finora, sulla forma della dipendenza della forza dalla distanza relativa tra le particelle? Le leggi empiriche, in ogni caso, ci potrebbero dare solo informazioni molto approssimate.

Sappiamo già la risposta se ricordiamo le considerazioni che abbiamo fatto intorno alla relazione di Gauss:

“la sola possibilità per la legge di forza tra particelle, nello schema de­mocriteo di atomi e vuoto, è la legge dell’inverso del quadrato della distanza”.

Notiamo che finora non abbiamo avuto bisogno di alcuna legge empiricamente derivata; praticamente si sono date soltanto delle definizioni; Newton, invece, assumeva come ipotesi che la legge dovesse essere:

 

 

Anche se, come qualcuno sostiene, avendo egli avuto modo di consultare gli inediti di Newton (vedi nota14), che lo stesso Newton facesse risalire tale legge ai pitagorici (e secondo noi non è improbabile), tuttavia egli, nel rivol­gersi ai suoi contemporanei, l’assumeva come ipotesi, giustificandola con il fatto che essa era in grado di spiegare i moti planetari, le maree, e molti altri fenomeni naturali; tuttavia, non giurava che essa potesse valere in generale e ipotizzava che, per le cariche elettriche, le cui forze erano molto più intense, in futuro, si sarebbe potuto osservare qualche deviazione; cosa che di fatto il futuro ha confermato. Non si chiedeva la causa di tale legge, semplicemente perché, allo stato delle conoscenze empiriche, non si potevano fare ipotesi (stante che l’ipotesi cartesiana dei vortici era insostenibile, come meticolo­samente si era impegnato a dimostrare). E, finché non si fossero osservati fenomeni rilevanti, sarebbe stato assurdo fingere delle ipotesi non verificabili: l’una sarebbe valsa l’altra, anche se matematicamente coerenti.

Ma vedremo, subito dopo, che, quando ci si voglia riferire alle “misure sensibili”, l’affermazione di Newton non contrasta con il risultato teorico generale che abbiamo sopra affermato, sull’inevitabilità della legge .

Molti interpretano la cautela, che qui manifesta il grande scienziato, co­me la propugnazione di un programma deontologico, secondo il quale bisogna rifuggire dal cercare le cause e ci si deve limitare alla semplice descrizione dei fenomeni; in altre parole, la tassonomia dovrebbe sostituire la scienza, secondo il programma aristotelico.

 

***

 

Per quanto riguarda lo spin, se l’osservatore baricentrico lo vedrà variare nel tempo, dirà che le particelle del corpo sono soggette a coppie esterne o, equivalentemente, che le forze che agiscono tra di esse non agiscono lungo la retta congiungente le due particelle, e il principio di azione e reazione, se dovesse valere, non lo potrebbe nell’accezione “forte”.

Il problema del tempo locale non lo disturberebbe, perché ciò riguarda solo i numeri che dalle formule generali si possono ricavare, quando si siano stabilite le opportune operazioni di misura e le relative unità di misura; mentre le relazioni, scritte sopra, sono in forma assoluta.

Scriviamo le relazioni assolute rispetto a due punti qualsiasi, O e O’, che possono, anche, rappresentare le origini di due riferimenti in moto relativo qualsiasi. Per l’identità algebrica soprascritta si avrà:

 .

 

Se assumiamo che le fi derivano solo dall’interazione tra tutte le particel­le del corpo, secondo il paradigma democriteo (tale ipotesi non è verificabile empiricamente in tutta la sua generalità, ma solo entro i limiti consentiti dalle nostre operazioni di misura), allora esse sono assolute, nel senso che non possono cambiare per effetto del moto relativo dei due osservatori. Ma, naturalmente, varieranno nel tempo, perché va cambiando la posizione rela­tiva di tutte le particelle; tuttavia la loro risultante e il momento totale delle forze, rispetto al baricentro, rimangono invariati per tutti i possibili osser­vatori; non così accade per le loro componenti (cioè le “misure sensibili” di Newton), le quali possono risultare diverse per i diversi osservatori.

Spesso nei libri di meccanica si introducono i concetti di “forza assoluta”, “forza relativa”, “forza di trascinamento”, “forza complementare”.

Conviene esaminarne più da vicino il loro significato fisico, perché queste forze apparenti possono modificare il risultato delle osservazioni empiriche e “apparentemente” violare le conclusioni teoriche generali che abbiamo sopra asserito.

Supponiamo che due osservatori O e O′, i quali abbiano scelto terne ortogonali di riferimento diverse e in moto relativo tra loro, considerino il moto di due punti arbitrari dello spazio P e A; sia - A il vettore relativo. Tale vettore è, in effetti, un ente assoluto in quanto indipendente da qualsiasi osservatore. Tuttavia sono diversi i parametri con i quali i due osservatori scompongono il vettore secondo le rispettive terne ortogonali scelte come riferimento.

Esaminiamo prima il caso più semplice, in cui i due osservatori usino unità di misura simili (cioè compiano le stesse operazioni di misura ognuno nel proprio riferimento; il confronto diretto tra le unità di misura dei due sistemi, in moto relativo, è impossibile e quindi non ha alcun significato fisico il chiedersi se le stesse operazioni fisiche fatte nei due sistemi conducano a unità di misura “uguali”), per cui possono porre uguale ad 1 il rapporto tra le lunghezze di uno stesso bipunto come misurate nei rispettivi riferimenti.

In tali circostanze, i vettori unitari della terna di un osservatore saranno legati a quelli dell’altro da un’“isometria” Ŭ   (Ŭ Ŭ = Ŭ  Ŭ = 1).

Quindi:

r = Ŭ Ŭ   r.

 

Derivando rispetto al tempo si ha:

 

 ;

 

per un teorema generale sulle isometrie,17 esiste un vettore w tale che  qualunque sia il vettore   r = Ŭ   r    e, in particolare, il primo termine di  diventa:

 

 .

 

D’altra parte, poiché Ŭ è operatore lineare sui vettori, si ha: se  = α i + β j + γ k e ′ = α i′ + β j′ + γ k′ (essendo i, j, k la terna ortogonale del riferimento di O e i′ , j′ , k  quella di O ′ ),

 

 .

 

Nel riferimento di O ′, per definizione, si ha: ; si trova che il termine  coincide con la derivata di r quando, a sua volta, O si volesse considerare in quiete.

Per tale ragione, quando si consideri il caso O = O  = A, si dice che  rappresenta la “velocità assoluta” di P, che si divide in un primo termine w Ù r che si chiama “velocità di trascinamento” e un secondo termine  che si chiama “velocità relativa”.

L’operatore  viene spesso chiamato la “derivata rispetto agli assi mobili” e si indica con . Ma certamente per O non è assolutamente una de­rivata (non lo è neanche per O ′), lo sarebbe solo nel caso che O si considerasse in quiete, rispetto ad un ipotetico sistema in quiete assoluta; cosa, però, che può legittimamente pensare ognuno dei due osservatori, attribuendo all’altro gli effetti inerziali.

Per cui la relazione di cui sopra, usualmente, si scrive

 

 .

 

Ciò per dire semplicemente che ha quelle componenti che avrebbe misurato O (assunto come riferimento mobile relativamente a un ipotetico ri­ferimento assoluto O ′) se, invece, si fosse considerato in quiete e alla quale si deve aggiungere (se vuole ottenere il valore effettivamente misurato), per effetto del moto relativo (che stranamente spesso si chiama moto assoluto) della sua terna, la velocità che avrebbe misurato O  se, a sua volta, il punto fosse stato fermo rispetto al riferimento di O; ma, naturalmente e allo stesso titolo, potremmo chiamare assoluta la velocità di P nel riferimento di O, per il semplice fatto che noi, come ricordava Newton, possiamo solo osservare i moti relativi.

In effetti i due osservatori misurano la stessa velocità, varia solo la lo­ro fittizia scomposizione in moto assoluto e moto relativo, dal momento che nessuno dei due potrà mai sapere se è fermo rispetto all’ipotetica “quiete as­soluta” o meno; infatti, solo per un ben determinato fenomeno, del quale, per ragioni puramente teoriche, si riesca a conoscere la legge del moto (cioè la re­lazione tra accelerazione misurata e forza ipotizzata), si può, entro gli errori di misura, stabilire l’approssimata coincidenza con la, matematicamente de­finita, “quiete assoluta”, che come abbiamo visto potrebbe solo significare il considerare fisso il baricentro dell’universo, ammesso che esista, ma tenendo presente che anche per tale ipotetico riferimento, varrano le stesse conside­razioni che abbiamo fatto prima, per il semplice fatto che il baricentro è un punto e, invece, il sistema di riferimento è un quadripunto.

Forse la cosa migliore sarebbe quella di abolire dal linguaggio della fisica termini quali “assoluto” e “relativo”, per il notevole deterioramento seman­tico subito nel corso dei secoli, quando appiccicati alla “quiete”.

Derivando una seconda volta rispetto al tempo si ottiene:

 

 

che con facili passaggi si può riscrivere:

 

 ,

 

questa viene usualmente scritta:

 

 .

 

Per le ragioni chiarite sopra, il termine a sinistra del segno di identità viene chiamato “accelerazione assoluta”, la somma dei primi due termini a destra “accelerazione di trascinamento”, il terzo termine a destra “accelera­zione complementare” e l’ultimo termine “accelerazione relativa”.

Tutti questi termini vengono individuati nel caso della terra: il primo, dei quattro termini a destra del segno =, si fa corrispondere alle fluttu­azioni che si osservano nella direzione che individua l’asse polare nel cielo delle stelle fisse, il secondo termine rappresenta la forza centrifuga, il terzo termine è l’accelerazione di Coriolis, l’ultimo si ottiene per differenza, allo scopo di confrontarlo con il valore teorico, dell’accelerazione di gravità, qu­ando ripulita dalle cosiddette forze “apparenti” o “d’inerzia”, che tuttavia contribuiscono al valore empiricamente misurato.

Ma è importante notare che la cosiddetta accelerazione “assoluta”, che poi, in effetti, è l’accelerazione “relativa” tra P ed O (od O ′, che è lo stesso punto) è veramente “assoluta”, ma nel senso che tutti gli osservatori ne misureranno sempre la stessa intensità, indipendentemente dal loro moto che può solo alterare il valore (il solo direttamente misurabile) delle sue componenti e la (apparente) classificazione tra forze effettive e forze di inerzia.

In tal senso si può accettare il (variamente interpretato) principio di Mach dicendo, in accordo con gli antichi, che senza materia non ci sono forze e senza forze non ci sono accelerazioni. Ma queste sono proprio le ipotesi che stanno alla base della fisica di Newton: infatti quest’ultimo sostiene che la forza acceleratrice e la forza motrice sono nomi diversi che diamo alla diversa apparenza sensibile di una sola e medesima cosa che, ovviamente, deve restare invariata per effetto di una qualunque arbitraria trasformazione.

D’altra parte, anche dal punto di vista della matematica, risulta asso­lutamente banale il fatto che non è possibile trasformare qualcosa se non si suppone che tale “qualcosa” esista indipendentemente da ogni possibile trasformazione che possiamo fare su di essa. P. es., la teoria della relatività sostituisce, nel ruolo di “cosa”, il quadrintervallo alla lunghezza; ma si trova in difficoltà nell’individuare la “cosa” da sostituire alle forze che agiscono tra due corpi. Ne segue che Mach avrebbe dovuto rivolgere la sua critica non alla fisica di Newton ma alla sua personale interpretazione della stessa.

Coll’algebra delle sostituzioni si possono dedurre le relazioni più generali relative a due riferimenti che non siano legati da un’isometria. P. es., nel caso che uno dei due osservatori scegliesse come unità di lunghezza la distanza tra due punti, che per l’altro osservatore, invece, apparissero in moto relativo arbitrario, si avrebbe una “similitudine”, variabile nel tempo; lo stesso av­verrebbe nel caso che le operazioni di misura del tempo fossero diverse per i due osservatori e si avesse un legame arbitrario ′ = f(t).

Se, inoltre, uno dei due osservatori assumesse definizioni operative di aree e di volumi diverse dalle usuali (cioè diverse da S = l2 e V = l3), si avrebbe una sostituzione più generale e, in tal caso, se uno dei due osservatori assumesse come valida la geometria euclidea sarebbe costretto a concludere che quella dell’altro non lo è; e, naturalmente, viceversa.

Sulla identità formale delle leggi della meccanica e di quelle dell’elettro­magnetismo, e sulla ingiustificata pretesa che le leggi della meccanica deb­bano soddisfare le cosiddette trasformazioni di Galileo rimandiamo ai nostri articoli, già citati, nel numero di Aprile 1991 dei Quaderni di Mondotre. Per concludere:

Stimiamo che l’aver trascurato il calcolo geometrico del Peano nello stu­dio della fisica sia stata un grandissima perdita per lo sviluppo della scienza, speriamo, anche, che l’opera di Peano venga risuscitata, per cominciare, nella didattica, alla quale il Peano teneva moltissimo.

 

 

NOTE

 

1 G. Peano Opere Scelte, a cura di U. Cassina, Edizioni Cremonese, Roma, 1958.   TORNA

2 G. Boscarino Peano e la filosofia, in Mondotre/Quaderni Ott. 1989. Siracusa.   TORNA

3 A. Pagano. Su di un’opera dimenticata di fisica di Boggio e Burali Forti, in Mondotre/Quaderni  Ott. 1989. Siracusa; e dello stesso autore: Riflessioni sulla didottica della fisica, ibidem. Apr. 1991.   TORNA

4 S. Notarrigo, Il linguaggio scientifico dei presocrotici analizzato con l’ideografia di Peano, in Mondotre/Quaderni, Ott. 1989, Siracusa.   TORNA

5 S. Notarrigo, La scienza e la fede, in Mondotre/Quaderni, Apr. 1991. Siracusa.   TORNA

6 G. Peano Opere Scelte, cit. vol. III. pag. 142.   TORNA

7 Ibidem, II, pag. 389.   TORNA

8 A leggere i vari libri sui fondamenti della matematica, circolanti in tutte le lingue, sembra che tali assiomi siano i soli contributi di Peano che vengono menzionati, anche se in modo concettualmente così distorto che qualcuno, addirittura, non riesce più a capire la differenza fondamentale che c’è con gli assiomi di Dedekind, per cui propone di assegna­re la primogenitura a quest’ultimo. Tale questione viene trattata da G. Boscarino. Le implicazioni filosofiche del concetto di numero (Con un saqgio di Peano in Appendice), in Mondotre/Quaderni, Apr. 1991. Siracusa.   TORNA

9 Vedi le citazioni pertinenti riportate nell’articolo citato nella precedente nota.   TORNA

10 Pensiamo che ogni fisico, almeno in qualcuno dei momenti dedicati alla riflessione sulla sua scienza, si sarà chiesto a cosa mai tali ineffabili enti possano servire. Una usuale risposta è che essi servirebbero a semplificare la dimostrazione di importanti teoremi, o addirittura a dimostrarne altri non ottenibili con altro mezzo. Ma tale risposta non sembra molto convincente, visto che Peano riesce a fare tutto quello che serve senza usare tali misteriosi enti: anzi, asserisce che ogni dimostrazione che usi l’assioma di Zermelo non è affatto una dimostrazione “secondo la comune accezione del vocabolo”.   TORNA

11 Cfr. G. Peano. Calcolo Geometrico, Bocca Editori, Torino, 1888. In una successiva (più sintetica) esposizione del suo calcolo Peano scriveva:  “Ed invero questi vari metodi di calcolo geometrico non si contraddicono fra loro. Essi sono le varie parti di una stessa scienza, ovvero i vari modi sotto cui si presenta lo stess soggetto a più autori, ciascuno dei quali lo studia indipendentemente dagli altri.  Poiché il calcolo geometrico, come ogni altro metodo, non è già un sistema di convenzioni, ma un sistema di verità. Così il metodo degli indivisibili (Cavalieri), degli infinitesimi (Leibniz), delle flussioni (Newton) sono la stessa scienza, piu o meno perfetta, ed esposta sotto forme diverse. E più otre: “…il            calcolo geometrico ha tutte le proprietà del calcolo algebrico sui polinomi. … Questa coincidenza dei due calcoli costituisce l’immenso vantaggio del metodo di Grassmann. Esso permette di operare e ragionare con  un grande risparmio di sforzo e di memoria; poichie in questo nuovo calcolo si opera come in una calcolo già conosciuto. Questo metodo risponde quindi al principio del minimo sforzo, il quale sussiste non solo in meccanica, ma anche in didattica”. Cfr. Peano, Opere Scelte, Vol. III. op. cit., p. 168 e 172.   TORNA

12 È sorprendente la disinvoltura con la quale un famoso fisico teorico può scrivere le parole di disperazione, qui appresso riportate, nella prefazione di un suo libro, dove si illustrano i progressi che si sono compiuti, a partire dalla teoria elettromagnetica di Maxwell: il quale ultimo, peraltro, aveva posto una grandissima attenzione alle unita di misura, nel suo Trattato; ma, a distanza di soli tre quarti di secolo da tale Trattato, il nostro moderno fisico confessa candidamente: “…personne n’a pu me dire comment concilier l’adoption des unités          électromagnétiques rationelles avec la nécessité pratique de se référer à des résultats expérimentaux exprimés dans l’ancien système d’unités. En désespoir de cause, j’y ai renoncé.”. Cfr. L. Rosenfeld, Theorie des electrons, Hermann, Paris, 1951. Notiamo che oggi non si sente nemmeno il bisogno di chiedere scusa per non sapere come collegare la teoria ai dati sperimentali!   TORNA

13 Nella prefazione di uno dei pochissimi libri di testo tradotti in italiano, dove si fa largo uso delle forme esterne di Grassmann, si legge: “In meccanica classica si utilizzano metodi e concetti matematici molto diversi: equazioni differenziali e flussi di fase, applicazioni regolari e varietà, gruppi e algebre di Lie, geometria simplettica e teoria ergodica. Molte delle moderne teorie matematiche hanno avuto la loro origine in problemi di meccanica e in seguito hanno assunto quella forma astratta ed assiomatica che ne rende così difficile lo studio”. Vedi V. I. Arnold, Metodi matematici della meccanica classica, Editori Riuniti, 1979: (per un testo didattico dove, invece, si usa l’approccio con i quaternioni di Hamilton si veda: D. Hestenes, New Foundations for Classical Mechanics, Reidel, 1987). A nostro parere non è lo studio che viene reso difficile dall’astrattezza, la quale se si volesse intendere come “astrazione”, invece, potrebbe semplificarlo, ma ne risulta difficile la comprensione quando, dal mondo iperuraneo (sempre facile e bello per definizione), si voglia scendere sulla terra per applicare il formalismo ai concetti della fisica; che, se si devono conformare alla natura, potrebbero risultare incompatibili con le elucubrazioni puramente astratte della nostra mente, quando non sorrette dal riferimento alle operazioni fisiche, le quali, spesso, vengono confuse con l’“intuizione”, che nessuno sa cosa mai possa essere.   TORNA

14 Cfr. Pierre Thuillier, Isaac Newton, un alchimiste pas comme les autres,in La Recherche, n. 212, Juillet – Août, 1989.   TORNA

15 Risulta a noi sorprendente il fatto che quasi tutti attribuiscano a Newton tale strana idea dello spazio assoluto in quiete assoluta, che ci sembra, piuttosto, debba attribuirsi all’assiomatizzazione di Eulero, come  mostreremo in altra pubblicazione.   TORNA

16 Nella letteratura moderna, per ragioni per noi incomprensibili, tale banale risultato, enunciato da Peano nel suo Calcolo Geometrico”, come una semplice applicazione, viene attribuito a Riesz.   TORNA

17 C. Burali – Forti, T. Boggio, Meccanica Razionale, Lattes, 1921.   TORNA