Hamiltons virkningsprinsipp

Hamiltons virkningsprinsipp gir en mer generell formulering av de fundamentale lovene i klassisk mekanikk enn den som ble innført av Isaac Newton. Det ble utviklet av den irske fysiker og matematiker William Rowan Hamilton rundt 1840 da han fant en ny definisjon av virkningen til et system basert på dets Lagrange-funksjon. Prinsippet sier at denne virkningen skal være minimal, og det er derfor tett knyttet opp mot variasjonsregning.

Ofte blir det omtalt som prinsippet om minste virkning selv om dette navnet i noen tilfeller kan være misvisende da den klassiske bevegelsen kan tilsvare en maksimal verdi av virkningen. Mer korrekt er å si at virkningen skal ha en ekstremalverdi som kan være et minimum eller et maksimum. Det er ekvivalent med å si at den skal være stasjonær. Prinsippet er en videreføring av Maupertuis' virkningsprinsipp som ble innført hundre år tidligere for mekaniske systemer. Dets store fordel kommer mest tydelig frem i beskrivelsen av kontinuumsmekanikk og i feltteorier.

Euler-Lagrange-ligningene som følger fra Hamiltons prinsipp, er differensialligninger av andre orden med hensyn på tiden. De sier noe om hvordan systemets energi fordeler seg mellom å være kinetisk T og potensiell V energi. Mens den totale energien for systemet er E = T + V, viste Hamilton at differensen L = T - V definerer en ny virkningen for systemets bevegelse. Den avhenger av variable som posisjon og hastighet og er Lagrange-funksjonen for systemet. For hvert tidspunkt t antar denne funksjonen en viss verdi avhengig av hvor systemet befinner seg og hvor raskt det forandrer seg. Beveger systemet seg fra et punkt A til et punkt B, er virkningen for bevegelsen gitt ved integralet

Vet man ikke nøyaktig hvordan systemet beveger seg, kan man beregne virkningen for hver tenkelig bevegelse. Av alle slike tenkelige bevegelser, velger så systemet den banen som vanligvis har den minste virkningen. Alltid skal virkningen ha en ekstremalverdi for den klassiske bevegelsen. Dette uttrykkes matematisk ved at variasjonen

Dermed er virkningen S stasjonær for små variasjoner rundt denne banen.

En dypere forståelse av dette virkningsprinsippet i klassisk fysikk kom først med formuleringen til Richard Feynman av kvantemekanikken. Denne er basert på vei-integral som er bygd opp av virkningene for hver tenkelig bevegelse. Hva som er alternative, matematiske bevegelser i den klassiske beskrivelsen går over til å bli virkelige, fysiske bevegelser i den kvantemekaniske beskrivelsen.

Hamilton viste også at Euler-Lagrange-ligningene kan erstattes med det dobbelte antall første ordens differensialligninger. Disse er basert på Hamilton-funksjonen som er definert ved H = T + V. Dette er energien for systemet slik at H også kan kalles for energifunksjonen. Denne formuleringen av klassisk mekanikk kalles Hamilton-mekanikk og danner grunnlaget for kvantemekanikken. Sammen med den ekvivalente Lagrange-mekanikken inngår Hamilton-mekanikken i det som vanligvis omtales som analytisk mekanikk.

Lagrange-mekanikk har en stor fordel fremfor Hamilton-mekanikk. Det er at den automatisk kan formuleres i overensstemmelse med Einsteins relativitetsteori og derfor også kan beskrive relativistiske systemer. Den kan også brukes til beskrivelse av kontinuerlige systemer hvor Lagrange-funksjonen er gitt som et volumintegral over en Lagrange-tetthet. Moderne kvantefeltteorier formuleres alle på denne måten.

Euler-Lagrange-likningenRediger

 
En liten variasjon δq av koordinaten q(t) tas med konstant tid t.

I det enkleste tilfellet kan det mekaniske systemet vi betrakter, beskrives ved bare en koordinat q = q(t). Det kan for eksempel være en partikkel med masse m hvor q angir dens posisjon. Den kinetiske energien er da

 

hvor   = dq/dt, mens den potensielle energien er gitt ved en funksjon V = V(q). Man kan også tenke seg at dette potensialet varierer med tiden slik at man mer generelt har at V = V(q,t). Lagrange-funksjonen for systemet er nå

 

For mer kompliserte situasjoner er det ikke mulig å splitte Lagrange-funksjonen slik opp i en kinetisk og en potensiell del. Hvordan Lagrange-funksjonen da ser ut, kan bli en mer vanskelig oppgave å finne ut av.[1]

For å beregne bevegelsen fra et punkt A = (tA , qA) til et punkt B = (tB , qB) fra Hamiltons virkningsprinsipp må man bestemme en stasjonær verdi for virkningen

 

Integralet er en funksjon av funksjonen q(t) og er derfor en funksjonal som angis ved firkantparentesen S[q].

Det gjøres systematisk ved variasjonsregning hvor man betrakter en liten variasjonen q(t) → q(t) + δq av banen som vist i figuren. Variasjonen av virkningen blir dermed

 

når man ser bort fra høyere ordens ledd. I siste ledd i integranden kan man nå foreta en partiell integrasjon som gir

 

Da alle baner skal gå gjennom endepunktene A og B, må variasjonen δq oppfylle kravene δq(tA) = δq(tB) = 0. Randleddet forsvinner derfor, og firkantparentesen i det første integralet må være null for at δS = 0. Dette gir Euler-Lagrange-ligningen

 

Den er den samme for alle systemer. Men Lagrange-funksjonen L vil være forskjellig fra system til system.[2]

Hvis Lagrange-funksjonen får et ekstra tillegg L → L + dG/dt som er en totalderivert med hensyn på tiden, vil det gi opphav til et ekstra bidrag

 

til variasjonen av virkningen. Men dette er null da variasjonene δq(tA) og δq(tB) begge er null i randpunktene. Euler-Lagrange-ligningen forblir derfor uforandret. Legg merke til at dette holder kun når funksjonen G(q,t) er uavhengig av den tidsderiverte av q(t).

BevegelseskonstanterRediger

Et generelt system er beskrevet ved N generelle koordinater q = (q1, q2, ... , qN). Disse behøver ikke å være komponenter av forskjellige posisjonsvektorer, men kan for eksempel oppstå ved bruk av ikke-kartesiske koordinatsystem. Begynnelsespunkt A og sluttpunkt B for bevegelsen er da begge angitt ved N slike koordinater. Virkningen må nå være stasjonær under variasjon q n(t)q n(t) + δq n(t) av alle disse koordinatene. Dermed får man en Euler-Lagrange-ligning for hver slik dynamisk variabel,

 

Det siste leddet i denne ligningen inneholder den tidsderiverte av hva som kalles den konjugerte impuls p n til koordinaten q n, det vil si at

 

Hvis Lagrange-funksjonen av en eller annen grunn ikke inneholder en koordinat q k slik at ∂ L/∂ qk = 0, så betyr det at dpk/dt = 0. Den tilhørende, konjugerte impuls er derfor uavhengig av tiden og dermed er

 

en bevegelseskonstant. Den tilsvarende variabel sies å være syklisk. Det kan i prinsippet være flere av dem, og de kan være til stor hjelp ved løsningen av Euler-Lagrange-ligningene for de andre koordinatene.

Fra den generelle variasjonsregningen vet man også at når tiden t ikke eksplisitt opptrer i Lagrange-funksjonen, vil størrelsen

 

være en bevegelseskonstant. Derfor er H = E en konstant når ∂ L/∂ t = 0. Denne bevegelseskonstanten er ikke noe annet enn energien for systemet. Uttrykker vi hastigheten   ved den tilsvarende, konjugerte impulsen p n, blir da H = H(q,p) Hamilton-funksjonen for systemet.[1]

VirkningsfunksjonenRediger

Euler-Lagrange-ligningen for en ikke-relativistisk partikkel med masse m som beveger seg fritt i en dimensjon, er   . Ligningen sier altså at den har konstant hastighet. Beveger den seg fra punkt A til B, er denne   = (qB - qA)/(tB - tA). Dette er hastigheten partikkelen har i klassisk mekanikk i motsetning til i kvantemekanikken. Man sier at det er dens klassiske hastighet. Virkningen for den klassiske bevegelsen er derfor

 

Normalt er den en funksjon av tre variable ta de to tidspunktene vil opptre sammen i differensen tB - tA . Hamilton kalte denne klassiske virkningen for den prinsipale funksjonen.[3]

Denne funksjonen har to interessante og viktige egenskaper. Tar man den deriverte med hensyn på en av koordinatene, finner man impulsen til partikkelen på samme sted,

 

Den deriverte med hensyn på tiden gir tilsvarende

 

som er energien til partikkelen, med motsatt fortegn. Selv om dette eksempelet er så enkelt at det ikke en gang er noen forskjell mellom Lagrange- og Hamilton-funksjonene, er de to resultatene for de deriverte av den klassiske virkningen eksempler på mer generelt gyldige egenskaper ved virkningsfunksjonen.

For å vise det, kan man betrakte to nærliggende klassiske baner q(t) og q'(t) = q(t) + δq(t) som begge starter i punktet A, men med litt forskjellig endepunkt B.

Hvis bevegelsene langs de to banene tar samme tid, men ankommer på litt forskjellig steder separert med δqB, vil de dermed ha litt forskjellig virkning

 

som utledes direkte som ved variasjonsregningen over. Det første leddet er null da begge banene er klassiske og oppfyller Euler-Lagrange-ligningen. I det siste leddet er den partiellderiverte gitt ved impulsen pB i sluttpunktet B. Resultatet δScl = pB δqB betyr at

 

Denne utledningen kan lett utvides til å gi et tilsvarende resultat for begynnelsepunktet A .

Alternativt kan man tenke seg at de to klassiske banene har samme endepunkt pB , men at q'(t) ankommer dette punktet δtB senere sammenlignet med q(t). Forskjellen i virkning δScl for disse to bevegelsene får da et bidrag før tiden tB av samme type pB δqB som beregnet over da de to banene ved dette tidspunktet ennå ikke er i samme punkt. For den korte tiden δtB etterpå oppstår ganske enkelt bidraget LB δtB. Her er LB verdien av Lagrange-funksjonen i sluttpunktet B. Tilsammen er dermed

 

I første leddet kan man skrive δqB = -  δtB. Derfor er

 

da man finner kombinasjonen av variable pB  - LB = HB som er Hamilton-funksjonen i sluttpunktet B.

Disse to generelle resultatene for de deriverte av virkningsfunksjonen spiller en sentral rolle i Hamiltons alternative formulering av Lagrange-mekanikken som naturligvis kalles Hamilton-mekanikk.

Ikke-relativistisk partikkelRediger

La oss betrakte en ikke-relativistisk partikkel med masse m som beveger seg i tre dimensjoner hvor dens posisjon i et kartesisk koordinatsystem er angitt ved posisjonsvektoren r. Den påvirkes av et ytre potensial slik at den har en potensiell energi gitt ved en funksjon V = V(r). Partikkelens bevegelse kan nå beregnes fra Lagrange-funksjonen

 

Den har en kanonisk impuls

 

slik at Euler-Lagrange-ligningen blir

 

Dette er ikke noe annet enn Newtons andre lov da F = - V er kraften som virker på partikkelen.

Potensialet V er antatt å være uavhengig av tiden. Derfor er partikkelens energi

 

konstant, H = E. Uttrykt ved impulsen p er dette Hamilton-funksjonen for dette systemet,

 

I kvantemekanikken danner denne grunnlaget for å skrive ned den tilsvarende Schrödinger-ligningen for partikkelens bevegelse.

Mer interessant er dette systemet når den potensielle energien V  ikke avhenger av retningen til posisjonsvektoren r, men bare av dens lengde r = |r|. Da er V = V(r), og systemet er symmetrisk under rotasjoner. De tilsvarende rotasjonsvinklene er derfor sykliske variable som gir opphav til at den konjugerte dreieimpulsen L = r × p er konstant. En annen måte å forstå det på er at i dette tilfellet peker kraften F = -V på partikkelen i radiell retning slik at dreiemomentet r × F på den er null og lar derfor dreieimpulsen forbli konstant. Dette kan generaliseres til å gjelde for lignende situasjoner i andre system og går under navnet Noethers teorem.

Relativistisk partikkelRediger

Fra den spesielle relativitetsteorien følger at Lagrange-funksjonen for en fri, relativistisk partikkel med masse m er

 

hvor c er lyshastigheten og v = dr/dt er partikkelens hastighet. Man kan nå beregne dens konjugerte impuls,

 

Kun i den ikke-relativistiske grensen v << c stemmer dette med det valige resulatet p = mv fra newtonsk mekanikk.[4]

Energien til partikkelen følger nå fra

 

Ekspanderer man kvadratroten her i den ikke-relativistiske grensen v << c, finner man at

 

Det første leddet tilsvarer partikkels hvileenergi E0 = mc2, mens andre leddet er den vanlige, kinetiske energien som brukes i ikke-relativistisk mekanikk. De høyere leddene blir viktige når partikkelens hastighet blir stor som man for eksempel har for elektronene i atomet.

Fra disse resultatene ser man at energi E og impuls p er forbundet ved relasjonen

 

i relativistisk mekanikk. Den kommer naturlig frem i den kovariante beskrivelsen av 4-dimensjonal tidrom.

Partikkel i elektromagnetiske feltRediger

En partikkel med ladningen q påvirkes av elektriske og magnetiske krefter som er konsekvens av det elektriske Φ = Φ(r,t) og det magnetiske potensialet A = A(r,t). Disse varierer i alminnelighet med tiden t og posisjonen r til partikkelen.[5] Har partikkelen massen m og beveger seg ikke-relativistisk, er den fra klassisk elektrodynamikk beskrevet ved Lagrange-funksjonen

 

hvor v = dr/dt er dens hastighet. Lagrange-funksjonen er invariant under elektromagnetiske gaugetransformasjoner. Impulsen til partikkelen er dermed

 

Det eksisterer ikke lenger en direkte sammenheng mellom partikkelens impuls og dens hastighet. Dette kommer klarest til uttrykk når den resulterende bevegelsen blir beskrevet i kvantemekanikken.[6]

I Euler-Lagrange-ligningen dp/dt = ∂L/∂ r behøver man nå

 

og

 

Euler-Lagrange-funksjonen blir dermed

 

I det siste kan man nå bruke det vektorielle trippelproduktet

 

til å skrive bevegelsesligningen på den enklere formen

 

når man innfører det elektriske feltet

 

og det magnetiske feltet

 

Den totale kraften på høyresiden av denne bevegelsesligningen er Lorentz-kraften.[7]

Hamilton-funksjonen for partikkelen følger nå fra

 

og danner grunnlaget for beskrivelsen av hvordan atomer vekselvirker med elektromagnetiske felt og absorpsjon/emisjon av lys.

Kontinuerlig systemRediger

La oss betrakte en lang kjede av massepunkt m fordelt langs x-aksen fra x = - L/2 til x = L/2 i avstand a fra hverandre. Med elastiske fjærer er hvert massepunkt knyttet til sine to nabopunkt. Alle fjærer er antatt å ha samme fjærkonstant k. Massepunktene er nummererte fra origo x = 0 hvor massepunkt med n = 0 er plassert. Massepunkt nummer n er i posisjon xn = na når det er i ro. Indeksen n kan anta både positive og negative verdier.

Disse massepunktene kommer nå i bevegelse langs x-aksen. Dette kan for eksempel skje ved at punkt nummer n kommer ut av sin likevektsposisjon med et utslag Qn. Alle punktene kommer da i bevegelse med den kinetiske energien

 

og den potensielle energien

 

Dermed blir Lagrange-funksjonen for denne svingende kjeden

 

Bevegelsen til hvert massepunkt kan nå finnes ved å løse de resulterende Euler-Lagrange-ligningene.

I stedet skal vi betrakte grensen hvor massepunktene ligger veldig tett. Matematisk tilsvarer det at avstanden a → 0 slik at massepunktene danner en kontinuerlig kjede hvor hver del kan bevege seg litt langs x-aksen. Skrives Lagrange-funksjonen om på formen

 

kan man da innføre massetettheten ρ = m/a og elastisitetsmodulen E = ka. I denne grensen blir utslaget Qn(t) en funksjon Q(t,xn) → Q(t,x) slik at

 

og differensen

 

I stedet for en sum kan da Lagrange-funksjonen skrives som et integral

 

hvor Lagrange-tettheten for den kontinuerlige kjeden nå kan skrives som

 

Den totale virkningen over et tidsintervall fra tA = - T/2 til tB = T/2 er gitt ved integralet

 

hvor den tidsderiverte er skrevet som Q,t = ∂Q/∂ t og den romlige deriverte som Q,x = ∂Q/∂ x. Under variasjonen QQ + δQ forandres dermed virkningen med

 

Nå er igjen δQ,t = ∂δQ/∂ t og δQ,x = ∂δQ/∂ x slik at man kan foreta partielle integrasjoner i t- og x-retning. Da variasjonen δQ skal være null ved alle integrasjonsgrenser, forsvinner randleddene fra integrasjonene. På samme måte som for tilfellet med en partikkel, må den gjenværende integranden være null og man står igjen med Euler-Lagrange-ligningen

 

Setter man inn her for Lagrange-tettheten til den svingende kjeden, finner man lett

 

Dette er bølgeligningen i en dimensjon for en bølge hvor

 

er hastigheten som utslagene eller svingningene til kjeden brer seg utover med langs x-aksen.

Kontinuerlig felt i tre dimensjonerRediger

Dette resultatet kan lett utvides til å gjelde for et kontinuerlig medium i tre romlige dimensjoner hvor utslaget i hvert punkt x er funksjonen Q = Q(t,x). Dette er et skalart felt med Lagrange-tettheten

 

Et eksempel på et slikt system er lydfeltet i luft eller et fast materiale. Beregningen av den tilsvarende Euler-Lagrange-ligningen foregår på samme måte.[3]

For å være litt mer generell kan man betrakte en virkning

 

Fra variasjonen QQ + δQ kommer man da frem til den generelle Euler-Lagrange-ligningen

 

for et skalart felt. Her i siste ledd er Q,j = ∂ Q/∂ xj og man summerer over de tre romlige retningene med koordinater xj = (x,y,z). Dette er et eksempel på bruk av Einsteins summekonvensjon. Fra Lagrange-tettheten for lydfeltet finner man ∂ Q,j = - E Q,j slik at (∂/∂xj )(∂ /∂Q,j) = - E ∇2Φ. Dermed resulterer Euler-Lagrange-ligningen i

 

som er den skalare bølgeligningen i tre dimensjoner

Klein-Gordon-feltetRediger

I kvantefeltteori er partikler med masse m og uten spinn kvantene til et skalart felt Φ = Φ(t,x) beskrevet ved Lagrange-tettheten

 

hvor c er lyshastigheten og   er Planck-Dirac-konstanten. Innsatt i den generelle tre-dimensjonale Euler-Lagrange-ligningen, gir denne nå bølgeligningen

 

Denne kalles vanligvis for Klein-Gordon-ligningen, og den gjelder blant annet for Higgs-partikkelen. Størrelsen   som opptrer her, er Compton-bølgelengden for partikkelen med masse m.[8]

Elektromagnetiske feltRediger

Bevegelsesligningene for det elektromagnetiske feltet er Maxwells ligninger. Disse må kunne utledes fra en Lagrange-funksjon som man a priori ikke kjenner til. De fundamentale feltene må være det elektriske potensialet Φ = Φ(r,t) og det magnetiske vektorpotensial A = A(r,t) som bestemmer både det elektriske feltet

 

og det magnetiske feltet

 

Denne siste ligningen ble innført for å oppfylle B = 0 som er Maxwells 2. ligning. Tilsvarende inneholder uttykket for det elektriske feltet Maxwells 3. ligning. Det ser man ved å ta curl av begge sider av ligningen. Det gir

 

Her har vi først benyttet at curl av en gradient er null, altså at ∇×∇ = 0 slik at det elektriske potensialet ikke bidrar. I leddet med det magnetiske potensialet har vi byttet om de to derivasjonene, det vil si skrevet at ×(∂A/∂t) = (∂/∂t)(×A) og brukt uttrykket for magnetfeltet. De to resterende Maxwell-ligninger er derfor Euler-Lagrange-ligninger som kan finnes fra variasjoner av den elektromagnetiske virkningen.[3]

Lagrange-tettheten må inneholde den elektriske energitettheten

 

hvor ε0 er dielektrisitetskonstanten i vakuum. Likedan må den inneholde den magnetiske energitettheten

 

hvor μ0 er permeabilitetskonstanten for vakuum. Da den elektriske delen inneholder tidsderiverte av vektorpotensialet, mens den magnetiske ikke inneholder slike variable, er det naturlig å anta at den elektriske energitettheten uE gir den kinetiske energien til Lagrange-tettheten. Den magnetiske energitettheten uB beskriver den potensielle energien til feltene. I tillegg kan vi ta med leddene som beskriver koblingen til elektrisk ladete partikler som gir opphav til en ladningstetthet ρ = ρ(r,t) og strømtetthet J = J(r,t). Koblingene kan man utlede fra Lagrange-funksjonen for en partikkel i et elektromagnetisk felt. Dermed kan det forventes at Lagrange-tettheten

 

vil gi de resterende Maxwell-ligningene. Først gjør vi en variasjon av det skalare potensialet Φ. Da er

 

Lagrange-tettheten inneholder ingen tidsderiverte av dette potensialet, men derimot de romlige deriverte Φ,j i den elektriske delen. Den gir

 

slik at

 

hvor vi igjen bruker Einsteins summekonvensjon og summerer over de to like indeksene i. Kombinerer vi disse to delresultatene, finner vi

 

som er Maxwells 1. ligning uttrykt ved forskyvningsfeltet D = ε0E.

Variasjon av vektorpotensialet gir ligninger som er litt mer komplisert å utlede. La oss betrakte komponenten Ai . Enklest å beregne er

 

Likedan finner man lett fra den elektriske delen i Lagrange-tettheten at de tidsderiverte komponentene Ai ,t gir

 

Den magnetiske delen av Lagrange-tettheten inneholder de romlige deriverte Ai ,j. Fra den får man

 

hvor vi bruker Einsteins summekonvensjon igjen og summerer over de to like indeksene k. Den deriverte av den magnetiske komponenten Bk finnes enklest ved å benytte formalismen med Levi-Civita-symbolet εi j k slik at man kan skrive curl på formen

 

Dermed er ∂ Bk/∂ Ai ,j = εk j i slik at man har

 

Euler-Lagrange-ligningen for denne romlige komponenten Ai  blir derfor

 

Det siste leddet her er i-te komponent av curl til det magnetiske feltet H = B/μ0 med et minus fortegn. Resultatet av beregningen blir dermed på vektorform

 

som er Maxwells 4. ligning.

Se ogsåRediger

ReferanserRediger

  1. ^ a b H. Goldstine: A History of the Calculus of Variations from the 17th through the 19th Century, Springer, New York (1980). ISBN 1-4613-8106-8.
  2. ^ L. N. Hand and J. D. Finch, Analytical Mechanics, Cambridge University Press, England (1998). ISBN 0-5215-7572-9
  3. ^ a b c H. Goldstein, Classical Mechanics, Addidon-Wesley Publishing Company, Reading, Massachusetts (1959).
  4. ^ L.D. Landau and E.M. Lifshitz, Merchanics, Pergamon Press, London (1959).
  5. ^ J. D. Jackson, Classical Electrodynamics, John Wiley & Sons, New York (1998). ISBN 0-4713-0932-X.
  6. ^ R.P. Feynman, The Schrödinger Equation in a Classical Context: A Seminar on Superconductivity, The Feynman Lectures on Physics, Volume III, Chapter 21.
  7. ^ L.D. Landau and E.M. Lifshitz, Classical Theory of Fields, Pergamon Press, London (1959).
  8. ^ J.J. Sakurai, Advanced Quantum Mechanics, Addison-Wesley Publishing Company, Reading, Massachusetts (1967).

LitteraturRediger

  • A. Sommerfeld, Vorlesungen über Theoretische Physik, Band I: Mechanik, Akademische Verlagsgellschaft, Leipzig (1964).