Kauzalne Dynamiczne Triangulacje

W 1948-tym roku, w artykule Space-Time Approach to Non-Relativistic Quantum Mechanics, Richard Feynman wprowadził nowatorskie podejście do mechaniki kwantowej, oparte o tak zwane całki po trajektoriach. W jego oryginalnym sformułowaniu, amplituda prawdopodobieństwa przejścia cząstki punktowej z pozycji x_i w chwili t_i do pozycji x_f w chwili x_f wyraża się poprzez następującą całkę:

\langle x_f, t_f |x_i, t_i \rangle = \int D x(t) e^{\frac{i}{\hslash} S[x(t)]},

gdzie S[x] to tak zwane działanie, będące funkcjonałem trajektorii x od punktu (t_i,x_i) do punktu (t_f,x_f). Działanie wyraża się poprzez funkcję Lagrange’a L (lagranżjan) w następujący sposób:

S[x(t)] = \int_{t_i}^{t_f} dt L(x(t),\dot{x}(t),t) .

Sformułowanie całek po trajektoriach mówi nam, że amplituda prawdopodobieństwa (tzw. propagator) \langle x_f, t_f |x_i, t_i \rangle jest całką (sumą) po czynnikach fazowych e^{\frac{i}{\hslash} S[x(t)]} dla wszystkich możliwych trajektorii x(t) biegnących od (t_i,x_i) do (t_f,x_f). Praktyka wygląda jednak nieco inaczej i w obliczeniach uwzględniane są zazwyczaj jedynie trajektorie które nie łamią przyczynowości (kauzalności).  Są to trajektorie które, w swoje drodze od x_i do  x_f, nie cofają się nigdy wstecz w czasie.  Obrazuje to rysunek poniżej:

pathintegral
Trajektorie kauzalne i akauzalne. 

Niebieskie krzywe na powyższym rysunku to trajektorie kauzalne. Dla tych trajektorii, w dowolnej chwili czasu, np. dla t_2, cząstka istnieje tylko w jednym miejscu, oznaczonym jako szary punkt. Dla porównania, czerwona krzywa przedstawia trajektorię akauzalną, dla której, w przedziale od t_3 do t_1, następuje cofanie się w czasie. Alternatywnie, możemy tę trajektorię zinterpretować w następujący sposób: Mianowicie, idąc w przód w czasie, od  t_i aż do chwili t_1,  mamy jedną cząstkę. Natomiast, w chwili  t_1 następuje kreacja cząstki i antycząstki. Przy czym, antycząstka porusza się wstecz w czasie i anihiluje z wyjściową cząstką w chwili t_3. Natomiast, powstała w chwili  t_1 cząstka podąża trajektorią kauzalną aż do t_f. Uwzględnienie procesów kreacji i anihilacji cząsteczek wychodzi, jednakże, poza opis cząstkowy i wymaga odwołania się do opisu w języku kwantowej teorii pola. Opis całek po trajektoriach dla cząstek nie jest więc wystarczający do tego by opisać trajektorie akauzalne, dla których możemy w pewnych momentach (np. w chwili t_2) obserwować więcej niż jedną cząstkę (np. w chwili t_2 mamy ich 3). Wato tu wspomnieć, że Richard Feynman jeszcze w czasach przed powstaniem nowoczesnej kwantowej teorii pola (której sam był współtwórcą) zastanawiał się nad znaczeniem akauzalnych trajektorii.  Opisuje to James Gleick w książce biograficznej Feynmana pt. “Geniusz”. Feynman miał mianowicie pomysł, iż wszystkie cząstki i antycząstki danego typu (np. elektrony i pozytony) są częścią jednej bardzo długiej pozawijanej w czasoprzestrzeni trajektorii. Przy czym, jej częściom skierowanym w przód w czasie odpowiadają cząstki, natomiast odcinkom skierowanym w tył w czasie odpowiadają antycząstki. Zmiany zwrotu takiej trajektorii w czasie (tak jak w t_1 i t_3 na rysunku powyżej) interpretujemy zaś jako kreacja lub anihilacja par cząstka-antycząstka. Obraz ten możemy, jedynie do pewnego stopnia, zachować w ramach współczesnej kwantowej teorii pól. W szczególności, antycząstki faktycznie można opisywać jako poruszające się wstecz w czasie cząstki (w sensie zadziałania na stan cząstki operacjami inwersji w czasie oraz parzystości). Nie wchodząc w dalsze szczegóły pomysłu Feynmana, zwróćmy jeszcze jedynie uwagę na kwestię prędkości, czyli pochodnej położenia po czasie, v = \frac{dx}{dt}. Na powyższym rysunku, różniczkowalność trajektorii  (brak “kolców”) powoduje, że zbliżając się do punktów w t_1 i t_3 dla (czerwonej) trajektorii akauzalnej, prędkoś v dąży do plus lub minus nieskończoności (w zależności od której strony dochodzimy do punktu zwrotu).  To zaś jest w sprzeczności ze Szczególną Teorią Względności która, poprzez lorentzowską geometrię czasoprzestrzeni Minkowskiego, wprowadza górne ograniczenie na prędkość rozchodzenia się informacji, równe prędkości światła w próżni.

Ograniczenie na prędkość propagacji nie istniałoby gdyby czasoprzestrzeń posiadała geometrię euklidesową. Choć wiemy, że w rzeczywistości tak nie jest, okazuję się jednak, że przejście z czasoprzestrzeni Minkowkiego do przestrzeni euklidesowej ma znacznie na gruncie rozważań teoretycznych.  Mianowicie, rozpatrywanie euklidesowych wersji teorii pozwala na analizę tak zwanych instantonów. Są to, dla cząstek,  rozwiązania w odwróconej studni potencjału, czyli w obszarach do których klasyczne cząstki nie mają dostępu. Rozważanie instantonów, w szczególności, pozwala wyznaczać prawdopodobieństwa tunelowania kwantowego.

Wick
Obrót Wicka na płaszczyźnie zespolonej.

Technicznie, przejście z czasoprzestrzeni Minkowskiego do przestrzeni euklidesowej możemy przeprowadzić za pomocą  obrotu Wicka.  Jest to przykład tak zwanego przedłużenia analitycznego, rozszerzającego rzeczywistą zmienną czasową t do dziedziny liczb zespolonych.  W tym szczególnym przypadku, dokonujemy zamiany t \rightarrow i \tau, gdzie \tau jest naszą nową (euklidesową) zmienną czasową, zaś i to jednostka urojona (i^2=-1). Obrót Wick ma bardzo ważne znacznie w podejściu całek po trajektoriach. Przekształca on mianowicie zespoloną całkę do postaci przypominającej rzeczywistą sumę statystyczną Z(T) (ang. partition function), rozważaną w fizyce statystycznej.  Co więcej, okazuje się, że jeśli rozważymy szczególny typ trajektorii w których wracamy do wyjściowego położenia po czasie \frac{\hslash}{k_{B}T}, (gdzie k_B to stała Boltzmanna) całka po trajektorii da nam dokładnie funkcję rozdziału dla temperatury T:

Z(T) = \int dx  \langle x, i \frac{\hslash}{k_{B}T} |x, 0 \rangle  = \oint D x(t) e^{-\frac{1}{\hslash} S_E[x(t)]},

gdzie S_E[x(t)] = -i S[x(t)] to tzw. działanie euklidesowe. Natomiast, przy całkowaniu \oint, spełniony jest warunek x(\tau=0)=x(\tau=\frac{\hslash}{k_{B}T}). Jest to ważny wynik gdyż pozwala rozpatrywać  całki po trajektoriach jako pewne układy statystyczne i stosować do ich obliczania metody znane z fizyki statystycznej. W szczególności, chodzi o symulacje komputerowe oparte na metodach Monte Carlo. Stan równowagi termodynamicznej takiego układu można natomiast związać z euklidesową trajektorią klasyczną (minimalizującą działanie S_E[x(t)]). Fluktuacje termiczne dualnego systemu statystycznego odpowiadają zaś fluktuacjom kwantowym wokół rozważanej wyjściowo trajektorii klasycznej.

Powyższe rozważania możemy zastosować nie tylko do cząstek, ale również do pól fizycznych, takich jak pole grawitacyjne. W przypadku grawitacji, całki po trajektoriach pozwalają analizować możliwe efekty kwantowej natury zjawisk grawitacyjnych. Jednym z najlepiej zbadanych podejść do grawitacji kwantowej, bazującym na całkach po trajektoriach, są tak zwane Kauzalne Dynamiczne Triangulacje (ang. Causal Dynamical Triangulations – CDT), wprowadzone przez Jana Ambjørna, Jerzego Jurkiewicza oraz Renate Loll i rozwijane już przez ponad 20 lat.  W przypadku tym, zamiast cząstki, rozważamy konfigurację pola grawitacyjnego, której odpowiada geometria przestrzenna. Rozważania w  ramach CDT przeprowadzono najpierw dla przypadku modelu przestrzeni jednowymiarowej, po czym uogólniono je dwóch oraz, finalnie, trzech wymiarów przestrzennych.

Ewolucji geometrii przestrzennej w czasie, odpowiada geometria czasoprzestrzenna. Konfiguracje czasoprzestrzenne, łączące dwa brzegowe (początkowy i końcowy) stany geometrii przestrzennej są zaś naszymi nowymi trajektoriami (analogicznie do przypadku rozważanej wcześniej cząstki punktowej).  Działaniem które należy rozważyć w całkach po trajektoriach jest tak zwane działania Hilberta-Einsteina, z którego można wyprowadzić (korzystając z zasady najmniejszego działania) równania ogólnej teorii względności (OTW). Do działania grawitacyjnego, można również dodać wkład odpowiadający polom materii, co jednak wprowadza dodatkowe komplikacje. W związku z tym, w przeprowadzonych dotychczas rozważaniach, koncentrowano się na tzw. przypadku próżniowym, uwzględniającym kontrybucję od (dodatniej) stałej  kosmologicznej \Lambda. Całkowite działanie ma, w tym przypadku, postać:

S= \frac{1}{16 \pi G} \int_{\mathcal{M}} d^4x \sqrt{-det(g)} (R-2\Lambda),

gdzie całkowanie odbywa się po rozmaitości \mathcal{M} z brzegami czasowymi \mathcal{B}_{i} oraz \mathcal{B}_{f}. Natomiast, G to stała Newtona, R jest skalarem krzywizny Ricciego, det(g) oznacza zaś wyznacznik z metryki czasoprzestrzennej g_{\mu\nu}.

W przypadku CDT, powyższe działanie poddawane jest obrotowi Wicka, umożliwiając przejście do geometrii euklidesowej. Z jednej strony, zabieg taki przeprowadza zespolony propagator do postaci rzeczywistej funkcji rozdziału, prowadząc do wspomnianego związku z fizyką statystyczną. Z drugiej jednak strony, geometria czasoprzestrzenna pozbawiana  zostaje stożków świetlnych, co pozwala na obecność akauzalnych wkładów do całki po trajektoriach.  Idea CDT opiera się na narzuceniu kauzalności trajektorii, pomimo rozważania teorii, wydawałoby się, euklidesowej. Wprowadzenie warunku kauzalności usuwa z całki po trajektoriach “gałęzie” odchodzące z głównego “pnia” czasoprzestrzeni łączącej stan początkowy | \mathcal{B}_{i} \rangle ze stanem końcowym | \mathcal{B}_{2} \rangle. Przedstawiono to na poniższym rysunku:

cdtpath2
Przykładowa trajektoria geometrii od konfiguracji początkowej | \mathcal{B}_{i} \rangle do konfiguracji końcowej | \mathcal{B}_{2} \rangle. W ramach Kauzalnych Dynamicznych Triangulacji, nie są dozwolone akauzalne rozgałęzienia geometrii.  

Jedynie w przypadku jednowymiarowej części przestrzennej możliwe okazało się uzyskanie amplitud prawdopodobieństwa w oparciu o obliczenia analityczne. Zbadania przypadków wyżej-wymiarowych, w tym tego odpowiadającego  czterowymiarowej czasoprzestrzeni, wymaga zastosowania metod numerycznych. Przeprowadzenie symulacji kwantowych ciągłych geometrii wymaga jednakże ich wcześniejszej dyskretyzacji, w celu zredukowania liczby stopni swobody. W praktyce, stosowana jest tak zwana dyskretyzacja Regge, bazująca na triangulacji ciągłej geometrii czasoprzestrzennej. Przygotowana w ten sposób dyskretna geometria, wraz z dyskretną wersją działania, stanowi punkt wyjścia do przeprowadzenia symulacji komputerowych.

Narzucenie na (dyskretne) trajektorie warunku kauzalności, przekłada się na zachowanie w czasie ich topologii. Na przykład, jeśli wyjściowa geometria przestrzenna posiada topologię okręgu \mathbb{S} (jak na rysunku powyżej), pozostaje nią w całym toku ewolucji. Złamanie kauzalności, poprzez  pojawienie się odnóg, powoduje że topologia przestrzenna ulega zmianie, na przykład poprzez rozszczepienie okręgu na dwa okręgi. Sytuację taką widzimy w dolnej części, umieszczonego powyższej, rysunku.

Najbardziej zaawansowane na świecie symulacje CDT przeprowadzane są od wielu lat w Zakładzie Teorii Układów Złożonych w Instytucie Fizyki  na Uniwersytecie Jagiellońskim w Krakowie. W symulacjach tych, przyjmuje się topologię przestrzenną 3-sfery (\mathbb{S}^3), bądź też trójwymiarowego torusa (\mathbb{S}\times \mathbb{S}\times \mathbb{S}). Przy czym, przypadek topologii 3-sfery został, jak dotąd, najlepiej przebadany i na dyskusji, otrzymanych dla niego, wyników się tutaj skupimy.

Pierwszym ważnym rezultatem przeprowadzonych symulacji jest wykazanie istnienia nietrywialnej struktury fazowej czasoprzestrzeni. Zagadnie to dyskutuję w moim wcześniejszym wpisie  “Stany skupienia grawitacji“. Jedna z obserwowanych faz, tak zwana faza C, odpowiada przypadkowi semi-klasycznemu, który koresponduje z rozwiązaniami klasycznej OTW. Ważną własnością fazy C jest to, że jej wymiar,  na odpowiednio dużych skalach, równy jest 4, co jest zgodne z przypadkiem czterowymiarowej czasoprzestrzeni w której żyjemy. Jednakże, analiza tak zwanego wymiaru spektralnego (ang. spectral dimension), wskazuje na to że wymiar spada kiedy rozpatrujemy odpowiednio małe skale przestrzenne i czasowe [Ambjorn, Jurkiewicz & Loll (2005)]. Jest to tak zwana redukcja wymiarowa, spotykana również w innych podejściach do kwantowej grawitacji. Redukcja wymiarowa wskazuje na to, że choć na odpowiednio dużych skalach geometria fazy C zgodna jest z euklidesową wersją czasoprzestrzeni de Sittera, to jednak na małych skalach wykazuje ona naturę kwantową. Dlatego też, określamy ją mianem semi-klasycznej, czyli korespondującej z fizyką klasyczną, jednakże wciąż wykazującą pewne własności kwantowe. Poniżej przedstawiono jak wygląda przykładowa semi-klasyczna trajektoria otrzymana w ramach komputerowych symulacji CDT.

CDT
Przykładowa trajektoria instantonowa, otrzymana w ramach Kauzalnych Dynamicznych Triangulacji.  Źródło

Jak należy rozumieć przedstawiony powyżej kształt? Po pierwsze, uściślijmy, że oś symetrii rotacyjnej powyższej geometrii odpowiada czasowi urojonemu \tau. Po drugie, w czasie tym narzucony jest symetryczny warunek brzegowy \mathcal{B}(\tau_i)=\mathcal{B}(\tau_f), wymagany w przypadku przejścia od całek po trajektoriach do funkcji rozdziału Z(T).

Okazuje się, że otrzymany kształt dla trajektorii semi-klasycznej (odpowiadającej stanowi równowagi termodynamicznej w ujęciu fizyki statystycznej) zgodny jest z rozwiązaniem dla klasycznego instantonu de Sittera. Instanton ten jest euklidesową trajektorią (pod barierą potencjału) dla modelu de Sittera w zakresie czynnika skali a \in [0,a_0], gdzie a_0 = \sqrt{\frac{3}{\Lambda}}. Aby otrzymać równanie trajektorii instantonowej, rozważmy wszechświat de Sittera (metryka FRW z dodatnią stałą kosmologiczną oraz dodatnią krzywizną przestrzenną), dla którego równanie Friedmanna przyjmuje postać:

\left(\frac{\dot{a}}{a} \right)^2 = \frac{\Lambda}{3} - \frac{1}{a^2}.

Rozwiązaniem tego równania jest funkcja hiperboliczna a(t) = a_0 \cosh (t/a_0). Jest to przykład nieosobliwej ewolucji, reprezentującego wszechświat ulegający najpierw kontrakcji, aż do minimalnej wartości czynnika skali równej  a_0, po czym następuje etap ekspansji. Zarówno kontrakcja jak i ekspansja przebiegają w sposób wykładniczy.

Niedozwolonym obszarem dla wprowadzonego powyżej przypadku lorentzowkiego jest przedział czynnika skali a \in [0,a_0), znajdujący się pod barierą potencjału dla tego modelu. Jednakże, dokonując  obrotu Wicka t \rightarrow i \tau przekształcamy rozwiązanie w postaci funkcji cosinus hiperboliczny do funkcji cosinus:

a(\tau) = a_0 \cos (\tau/a_0),

tak, że a \in [0,a_0]. Jest to poszukiwane rozwiązanie euklidesowe, dla obszaru pod barierą potencjału modelu lorentzowskiego. Ponieważ czynniki skali a jest zdefiniowany jako wartość nieujemna, rozwiązanie instantonowe jest dobrze określone w  skończonym przedziale czasu urojonego:  \tau \in [- \frac{\pi}{2}a_0, \frac{\pi}{2}a_0]. Znając ewolucję czynnika skali możemy wyznaczyć również ewolucję objętości, która wyraża się jako  V(\tau) = 2 \pi^2 a^3(\tau) =2 \pi^2 a^3_0 \cos^3 (\tau/a_0). Okazuje się, że funkcja ta jest zgodna z wynikami symulacji przeprowadzonymi w ramach CDT. Mówiąc ściślej, pokrywa się ona z, otrzymaną z uśrednienia po trajektoriach, zależnością objętości części przestrzennej od czasu \tau [Ambjorn, Jurkiewicz & Loll (2004)].

Pokrywanie się przewidywań CDT z klasyczną geometrią przestrzeni de Sittera to bardzo istotny rezultat. Pokazuje on, że jednorodna i izotropowa klasyczna czasoprzestrzeń może wyłonić się jako wynik uśrednienia kwantowych (często bardzo niejednorodnych) trajektorii. Ponadto, w przeciągu ostatnich lat pokazano, że również przewidywane w ramach CDT fluktuacje kwantowe instantonu są z godne z przewidywaniami analitycznymi bazującymi o model de Sittera [Ambjorn, Gorlich, Jurkiewicz & Loll (2008)]. Wyniki te, jak również rezultaty dotyczące struktury fazowej grawitacji oraz redukcji wymiarowej, dają impuls do tego by zacząć myśleć o weryfikacji empirycznej przewidywań CDT. O ile trudno tu mówić o wykorzystaniu naziemnych eksperymentów, to przewidywania dotyczące kosmologii wczesnego wszechświata rodzą pewne nadzieje na narzucenie więzów obserwacyjnych na przewidywania CDT.

Pierwszy krok w tym kierunku poczyniłem w moim artykule From causal dynamical triangulations to astronomical observationsEPL 119 (2017) no. 6, 60003 [arXiv:1503.08794], w którym rozważałem możliwość wykorzystania obserwacji mikrofalowego promieniowania tła do badania, przewidywanej w ramach CDT,  redukcji wymiarowej. Jak pokazały obliczenia, pewne szczególne (mało prawdopodobne) scenariusze ewolucji wczesnego wszechświata, uwzględniające przewidywania CDT, już dzisiaj można wykluczyć na postawie obserwacji astronomicznych. Dokonanie znaczącego postępu w tym kierunku w najbliższych latach, nie będzie jednak zadaniem łatwym.

Niezależnie jednak od możliwości weryfikacji empirycznej, zaawansowane symulacje komputerowe kwantowej czasoprzestrzeni, prowadzone w ramach Kauzalnych Dynamicznych Triangulacji, dają nam unikalną możliwość zrozumienia tego jak klasyczna czasoprzestrzeń może wyłaniać się z dynamiki ogromnej liczby kwantowych “cegiełek” na skali Plancka. Wszak jak pozostawił napisane na swojej tablicy Richard Feynman: “What I cannot create, I do not understand.”

© Jakub Mielczarek

Zwarte przestrzenie fazowe

Jednym z zagadnień, nad którym obecnie pracuję, jest konstrukcja teorii pól z tak zwanymi zwartymi przestrzeniami fazowymi. Teorie takie są uogólnieniem powszechnie rozważanych w fizyce teoretycznej teorii z afinicznymi (płaskimi) przestrzeniami fazowymi. Kierunek badawczy związany z uzwarcaniem przestrzeni fazowych pól fizycznych zainicjowaliśmy, wspólnie z dr Tomaszem Trześniewskim, w 2016-tym roku w pracy “The Nonlinear Field Space Theory” Phys. Lett. B 759 (2016) 424 (open access). Badania te kontynuujemy obecnie w ramach grantu Sonata Bis 7 z NCN pt. “Teorie pola ze zwartymi przestrzeniami fazowymi − od grawitacji do układów złożonych”. Jednym z ambitnych celów tego projektu jest zbudowanie (kwantowej) teorii grawitacji, cechującej się zwartą przestrzenią fazową. O wynikach prowadzonych przez nas badań napiszę więcej w jednym z kolejnych wpisów. Tutaj zaś chciałbym przygotować niezbędną podbudowę teoretyczną do dyskusji  naszych dotychczasowych rezultatów. Przedstawię mianowicie ideę zwartej przestrzeni fazowej na przykładzie układu fizycznego z jednym stopniem swobody, co można uważać za teorię pola skalarnego w punkcie (w przestrzeni zerowymiarowej).

Rozważmy więc pojedynczy stopień swobody, opisywany zmienną q. Wartości q należą do, tak zwanej, przestrzeni konfiguracyjnej \mathcal{C}, którą wyjściowo przyjmijmy za zbiór liczb rzeczywistych, \mathcal{C} = \mathbb{R}. Zmienna q może więc przyjmować dowolną wartość z zakresu liczb rzeczywistych i opisywać stopień swobody wybranego układu fizycznego. Jeśli, na przykład, interpretujemy q jako wartość pola skalarnego w punkcie, to wybór \mathcal{C} = \mathbb{R} oznacza, że pole to może zmieniać swoją wartość w zakresie od - \infty do +\infty. Jeśli zaś q opisuje położenie cząstki, to wybór \mathcal{C} = \mathbb{R} mówi nam, że mamy do czynienia z ruchem w jednym wymiarze przestrzennym, po całej osi liczb rzeczywistych.

Do pełnego scharakteryzowani stanu cząstki nie wystarczy podanie jej położenia. Tak samo, do określenia stanu pola nie wystarczy znajomość jego wartości. W obydwu przypadkach, konieczne jest określenie również tego jak q zmienia się w czasie. Informację tę zawiera, sprzężony z q, pęd kanoniczny p. Pary (q,p) wyznaczają zaś punkty należące do, tak zwanej, przestrzeni fazowej \Gamma. Z geometrycznego punktu widzenia, przestrzeń fazowa jest zazwyczaj tzw. wiązką kostyczną do przestrzeni konfiguracyjnej:

\Gamma = T^*(\mathcal{C}) := \left\{ (q,p) : q \in \mathcal{C}, p \in T_q^*(\mathcal{C}) \right\} ,

gdzie T_q^*(\mathcal{C})  to przestrzeń kostyczna do przestrzeni \mathcal{C} w punkcie q. Dla rozważanego przypadku \mathcal{C} = \mathbb{R}, otrzymujemy \Gamma = T^*(\mathcal{C}) = \mathbb{R} \times \mathbb{R} = \mathbb{R}^2, czyli płaszczyznę rzeczywistą. Dowolny punkt na tej płaszczyźnie reprezentuje stan układu klasycznego. Ewolucji układu w czasie odpowiadają zaś trajektorie (rysunek poniżej).

PhaseSpace
Przestrzeń fazowa \Gamma = T^*(\mathcal{C}) = \mathbb{R}^2, gdzie \mathcal{C}= \mathbb{R}T_{q_0}^*(\mathcal{C}) to przestrzeń kostyczna do przestrzeni \mathcal{C} w punkcie q_0. Wiązka kostyczna jest sumą rozłączną przestrzeni kostycznych dla wszystkich q_0 \in \mathcal{C}. Czarna trajektoria reprezentuje ewolucję układu w czasie. Niebieski punkt wskazuje na jednen ze stanów układu.

Istnieją jednak przypadki w których przestrzeni fazowej nie możemy wyrazić jako wiązki kostycznej  \Gamma = T^*(\mathcal{C}). Przykładem tego jest chociażby (zwarta) przestrzeń fazowa o geometrii sfery, którą przedyskutujemy dokładniej w dalszej części.  Przypadek ten wpisuje się natomiast w ogólną definicję przestrzeni fazowych, jako tak zwanych rozmaitości symplektycznych, czyli rozmaitości różniczkowych posiadających zamknięte formy różniczkowe

\omega = \frac{1}{2} \omega_{ij} dx^i \wedge dx^j,

gdzie, dla rozważanej wcześniej przestrzeni fazowej  \Gamma = \mathbb{R}^2, i =1,2 oraz x_1=q i x_2=p a forma różniczkowa przyjmuje postać \omega = dp \wedge dq. Symbol \wedge oznacza tak zwany iloczyn zewnętrzny (ang. exterior product) form różniczkowych, w rozważanym przypadku 1-formy dp oraz 1-formy dq. Zamkniętość  2-formy \omega oznacza zaś, że d\omega = d(dp \wedge dq) = 0. Niniejsza własność gwarantuje spełnienie tzw. tożsamości Jacobiego, która zaś implikuje łączność algebry Poissona. Algebra ta konstruowana jest w oparciu o nawias Poissona \{f,g\} :=\mathcal{P}^{ij}(\frac{\partial f}{\partial x^i})(\frac{\partial g}{\partial x^j}), gdzie \mathcal{P}^{ij} :=(\omega^{-1})^{ij} to tak zwany tensor Poissona, otrzymywany przez  odwrócenie formy symplektycznej \omega (co nie zawsze jest możliwe). Dla rozważanego przypadku \Gamma = \mathbb{R}^2, nawias ten wyraża się jako \{f,g\} = \frac{\partial f}{\partial q} \frac{\partial g}{\partial p}- \frac{\partial f}{\partial p} \frac{\partial g}{\partial q} , tak że dla pary kanonicznie sprzężonych zmiennych q i p otrzymujemy \{q, p\}=1. Wykorzystując nawias Poissona, możemy wprowadzić równanie Hamiltona \frac{df}{dt} = \{f, H\}+\frac{\partial f}{\partial t}, gdzie H jest tak zwaną funkcją Hamiltona (hamiltonianem), zaś f jest dowolną funkcją na przestrzeni fazowej. Równanie to opisuje ewolucję w czasie t układu fizycznego.

Płaskie (afiniczne) przestrzenie fazowe, tak  jak rozważany tu przypadek \Gamma = \mathbb{R}^2 mają szerokie zastosowanie do opisu świata fizycznego. Jednakże, w wielu przypadkach, nieograniczoność tych przestrzeni prowadzi do trudności. Na przykład,  w przypadku teorii pól, afiniczność przestrzeni fazowej przekłada się na nieograniczoność energii (hamiltonianu), będącej funkcją zmiennych fazowych. To zaś skutkuje możliwością pojawienia się niefizycznych nieskończoności. Lista potencjalnych problemów jest dłuższa. Możliwym sposobem na ich rozwiązanie jest uzwarcenie przestrzeni fazowej. Poniżej, przedstawię jak taka procedura  wygląda w przypadku \Gamma = \mathbb{R}^2 (płaszczyzna) uzwarconej do \Gamma = S^2 (sfera).

Rozważmy zatem sferyczną przestrzeń fazową, tak by w granicy gdy jej promień dąży do nieskończoności, odzyskiwać przypadek przestrzeni fazowej  \Gamma = \mathbb{R}^2. Innymi słowy, płaska przestrzeń fazowa będzie lokalnym przybliżeniem dla przestrzeni sferycznej,  w podobny sposób jak geometria euklidesowa jest lokalnym przybliżeniem dla (nieeuklidesowej) geometrii sferycznej.  Zamiast jednak rozważać kąty i długości, w przypadku przestrzeni fazowej obiektem naszego zainteresowania będzie forma symplektyczna \omega.

Naturalnym wyborem formy symplektycznej dla sfery jest 2-forma powierzchni \omega = S \sin \theta d \phi \wedge d \theta. Kąty \phi \in (-\pi, \pi] oraz \theta \in [0,\pi] to standardowe kąty w sferycznym układzie współrzędnych. Stała S została zaś wprowadzona ze względów wymiarowych, tak by forma symplektyczna  \omega miała wymiar powierzchni na płaszczyźnie fazowej 2D, czyli położenie razy pęd (= moment pędu). W celu wyrażenia tej formy poprzez zmienne q oraz p, wykorzystywane w przypadku \Gamma = \mathbb{R}^2, wykonajmy następującą zmianę zmiennych:

\phi = \frac{q}{R_1}  oraz  \theta = \frac{\pi}{2}-\frac{p}{R_2},

gdzie R_1 i R_2 to parametry wprowadzone ze względów wymiarowych. Stosując to do formy \omega = S \sin \theta d \phi \wedge d \theta, otrzymujemy:

\omega= \frac{S}{R_1R_2} \cos\Big(\frac{p}{R_2}\Big)dp\wedge dq.

Chcąc by w granicy R_1\rightarrow \infty oraz R_2 \rightarrow \infty, powyższa forma redukowała się do przypadku płaskiego, czyli \omega=dp\wedge dq, musimy przyjąć by S = R_1 R_2.

Sphere
Afiniczna (płaska) przestrzeń fazowa \Gamma = \mathbb{R}^2 może być rozpatrywana jako lokalne przybliżenie zwartej przestrzeni fazowej, na przykład o geometrii sfery \Gamma = S^2.

Spełnienie warunku poprawnej granicy afinicznej implikuje więc, że 2-forma \omega dla (zwartej) sferycznej przestrzeni fazowej ma postać:

\omega=\cos\Big(\frac{p}{R_2}\Big)dp\wedge dq.

Podobnie, jak w rozważanym wcześniej przypadku \Gamma = \mathbb{R}^2, w oparciu o formę symplektyczną możemy wyznaczyć postać nawiasu Poissona dla sferycznej przestrzeni fazowej:

\{f,g\} =  \frac{1}{\cos\Big(\frac{p}{R_2}\Big)}\left( \frac{\partial f}{\partial q} \frac{\partial g}{\partial p}- \frac{\partial f}{\partial p} \frac{\partial g}{\partial q}\right).

Różnica z przypadkiem \Gamma = \mathbb{R}^2 polega na obecności czynnika 1/\cos\Big(\frac{p}{R_2}\Big). W konsekwencji, nawias Poissona pomiędzy zmiennymi kanonicznymi przyjmuje postać \{q,p\} =  1/\cos\Big(\frac{p}{R_2}\Big).  Warto tu podkreślić, że zmienne q oraz p są dobrze zdefiniowane na sferze jedynie lokalnie.  Ich wartości nie zmieniają się na sferze w sposób ciągły. W szczególności, q \in (-\pi R_1, \pi R_1], tak że w puncie q= \pi R_1 następuje nieciągłość.  O ile, nie ma to znaczenia w przypadku kiedy rozważamy małe wartości q (w otoczeniu granicy afinicznej), tak w przypadku analizy globalnych własności sferycznej przestrzeni fazowej zasadne jest wprowadzenie zmiennych które zdefiniowane są w sposób globalny.  Naturalnym wyborem takich zmiennych jest parametryzacja sfery w kartezjańskim układzie współrzędnych. Dowolny punkt na sferze może być więc wskazywany przez wektor \vec{S}=(S_x,S_y,S_z) o składowych:

S_x:= S \sin\theta \cos\phi = S \cos \left( \frac{p}{R_2} \right) \cos \left( \frac{q}{R_1} \right),

S_y:= S \sin\theta \sin\phi = S \cos \left( \frac{p}{R_2} \right) \sin \left( \frac{q}{R_1} \right),

S_z:= S \cos\theta = S \sin \left( \frac{p}{R_2} \right).

Przy czym, spełnione jest równanie sfery  \vec{S}\cdot\vec{S}= S_x^2+S_y^2+S_x^2=S^2. Wykorzystując nawias Poissona dla sferycznej przestrzeni fazowej, możemy teraz pokazać że składowe wektora \vec{S} spełniają następującą relacje:

\{S_x,S_y\} = S_z, \ \ \ \{S_z,S_x\} = S_y, \ \ \ \{S_y,S_z\} = S_x.

Jest to tak zwana algebra su(2).  Oznacza to, że składowe wektora \vec{S} są generatorami obrotów, co jest konsekwencją  symetrii sferycznej przestrzeni fazowej. Zgodnie więc z definicją,  wektor \vec{S}, którego składowe spełniają powyższą algebrę, nazywamy momentem pędu (lub spinem). Fakt, iż sferyczna przestrzeń fazowa jest przestrzenią fazową momentu pędu ma daleko idące konsekwencje. W szczególności, obserwacja, że sferyczna przestrzeń fazowa (momentu pędu lub spinu) może być lokalnie opisywana przez płaską przestrzeń fazową z jednym stopniem swobody stała się podstawą do wprowadzenia, przeze mnie w 2017-tym roku, tak zwanej Korespondencji Spin-Pole  (Spin-Field Correspondence).  Korespondencja ta wiąże, w granicy dużego spinu (S\rightarrow \infty), znane afiniczne teorie pola z układami spinowymi. W szczególności, jak pokazaliśmy z moimi współpracownikami z Uniwersytetu Fudan w Szanghaju w pracy  “Klein-Gordon field from the XXZ Heisenberg model” (przyjęte do druku w International Journal of Modern Physics D), pole skalarne Kleina-Gordona można otrzymać z łańcucha spinowego XX Heisenberga (model XXZ Heisenberga w granicy \Delta \rightarrow 0 parametru anizotropii).

Posłużyłem się powyżej określeniem spin, które zarezerwowane jest do określenia wewnętrznego momentu pędu cząstek, bezpośrednio związanego z jej kwantową naturą  i wyrażającego się w ułamkach (n/2, gdzie n = 0,\frac{1}{2}, 1, \frac{3}{2}, \dots) zredukowanej stałej Plancka \hslash.  Jednakże, jak dotąd, nasze rozważania były skupione na analizie klasycznych przestrzeni fazowych, dla których wartość momentu pędu S pozostawała nieokreślona. Dla kompletności naszych rozważań, zakończymy więc naszą dyskusję zarysem analizy przypadku kwantowego. Mianowicie, w ujęciu kwantowym, stan układu nie jest opisywany przez punkt w przestrzeni fazowej lecz przez wektor w przestrzeni Hilberta (warto tu zaznaczyć, że w podejściu zwanym mechaniką kwantową na płaszczyźnie fazowej, stan kwantowy układu można związać z tak zwaną funkcją gęstości kwaziprawdopodbieństwa (funkcja Wignera) określoną na przestrzeni fazowej). Wymiar przestrzeni Hilberta, czyli ilość liniowo niezależnych wektorów bazowych, wiąże się natomiast z powierzchnią przestrzeni fazowej. Mianowicie, zasada nieoznaczoności Heisenberga mówi nam, że iloczyn nieoznaczoności pomiarów q i p ograniczony jest od dołu w następujący sposób (dla przypadku płaskiej przestrzeni fazowej):

\Delta q \Delta p \geq \frac{\hslash}{2}.

Nie możemy dokładniej wyznaczyć więc klasycznego stanu stopnia swobody na płaszczyźnie fazowej niż jako powierzchni \sim \hslash. Do opisu układu, którego przestrzeń fazowa ma powierzchnię A potrzebujemy więc około A/\hslash niezależnych wektorów w przestrzeni Hilberta. W przypadku płaskiej przestrzeni fazowej, z uwagi na nieskończoność powierzchni, przestrzeń Hilberta musi więc posiadać nieskończony wymiar.  Jednakże, dla przypadku sfery \Gamma=S^2, powierzchnia przestrzeni fazowej jest równa:

A =  \int_{\Omega} \omega = 4 \pi S < \infty,

gdzie wykonano całkowani po pełnym kącie bryłowym \Omega. Wymiar przestrzeni Hilberta jest więc skończony i proporcjonalny do \sim S/\hslash. Ponieważ wymiar przestrzeni Hilberta jest liczbą naturalną, dozwolone są jedynie pewne wartości S, będące wielokrotnością stałej Plancka \hslash. Sama zwartość przestrzeni fazowej implikuje więc kwantowanie momentu pędu (spinu). Dokładny rachunek, wykorzystujący kwantowanie algebry su(2) lub też stosując tak zwane kwantowanie geometryczne sfery, mówi nam, że wymiar przestrzeni Hilberta dla spinu wyraża się jako \text{dim} H_s = 2s+1, gdzie s=0,\frac{1}{2}, 1, \frac{3}{2}, \dots. Natomiast, powierzchnia przestrzeni fazowej wyraża się jako  4 \pi S =4 \pi \hslash s .  Jeśli, na przykład, rozważymy spin elektronu, dla którego s=1/2, odpowiadająca mu powierzchnia przestrzeni fazowej będzie równa 2\pi \hslash.  

© Jakub Mielczarek

Esej o poznawaniu

Doświadczenie czegoś po raz pierwszy ekscytuje lub też spotyka się z brakiem naszej akceptacji dla rzeczy nowej. Powtarzanie zaś przyzwyczaja, prowadząc ostatecznie do znudzenia i zobojętnienia. Jakże ważne jest więc by rzecz cenną dla naszego umysłu smakować po trochu, unikając poczucia sytości. Błędem i szkodą jest tym samym uczynienie wyjątkowości powszednią. Choć powstrzymanie się przed taką pokusą nie jest sprawą prostą i wymaga nie lada dyscypliny.

Umysł ludzki szybko przyzwyczaja się do otoczenia w którym przyjdzie mu funkcjonować. Musi działać i walczyć o przetrwanie. Otoczenie, które prędzej czy później staje się tylko sceną, jest tłem dla aktywności decydujących o naszym losie.

Momentem w którym to jednak scenografia a nie sama życiowa rola wręcz musi być obiektem naszego zainteresowania jest dzieciństwo. Wtedy to też silnie kształtuje się świadomość która osadza nas w otaczającej rzeczywistości. Tak byśmy mogli w niej właściwie funkcjonować i odgrywać nasze życiowe role.

Umysł dziecka poznającego scenografię w której przyjdzie mu kiedyś walczyć o swój los pełen jest zachwytu i otwartości. Poczucie wstydu przed zadaniem niby zbyt naiwnego pytania jest mu obce. Wszak każda nowa informacja może uczynić przyszłe zmagania lżejszymi. To też umysł dziecka pytań zadaje co niemiara. Równocześnie, będąc uważnym obserwatorem swojego otoczenia.

Z czasem jednak uwaga ta zatraca się. Rytm dnia zarzyna narzucać jedynie podstawowy takt dla naszych działań. Cykliczność pór roku nabiera wymiar praktyczny, sprowadzając się do tak prozaicznych czynności jak zmiana przyodziewku. Oswojenie się z faktem przemijalności życia narzuca zaś ramy czasowe dla naszej aktywności i wymusza przyjęcie różnych strategii radzenia sobie z tymi nie koniecznie pożądanymi okolicznościami. O ile od czasu do czasu jakiś silny impuls potrafi ponownie wyrwać umysł ze sfery jego codziennej aktywności, to są to zazwyczaj już jedynie tyko epizody, zakończone szybkim powrotem do pewnego stanu ustalonego.

Jednym z najważniejszych pytań jakie pojawia się w umyśle dziecka jest to dotyczące przyczyny istnienia jego i świata który go otacza. Nie dzieje się to jednak tak szybko. Umysł dziecka stopniowo rozszerza sferę swojej percepcji otoczenia. Jego cały świat to początkowo łóżeczko w którym sypia. Z dnia na dzień poznaje pokój a następnie dom i podwórko. Poznawane jest kolejno miasto a odleglejsze wyjazdy kształtują pojęcie kraju. Zabawa z globusem stopniowo przyzwyczaja do myślenia o świecie jako kuli na powierzchni której żyjemy. Odpowiedzi na pytania dotyczące dwóch najbardziej wyraźnych obiektów na naszym niebie: Słońca i Księżyca pozwalają rozszerzyć percepcję dziecka o kolejny krok. Spektakularne zdjęcia galaktyk wzbudzają ciekawość do jeszcze potężniejszych skal. W małej główce dziecka zaczynają się kłębić myśli o czymś tak ogromnym, że nie jest w stanie nawet tego zobaczyć, a czego częścią przecież samo jest.

Pytanie dotyczące istnienia bierze swoje źródło również w innej obserwacji. Rzeczy, z pozoru, mogą istnieć ale również nie istnieć. To samo dotyczy zdarzeń które zachodzą lub też nie zachodzą. W pudełku dziecko znajduje cukierek lub też tam tego cukierka nie ma. Ludzie rodzą się i umierają. Słońce świeci w dzień i znika w nocy. A noc to ciemność.

Każdy kto pamięta zabawę w chowanego lub też obserwował bawiące się w chowanego dzieci mógł zauważyć bardzo charakterystyczne zachowanie. Mianowicie, małym dzieciom do schowania się wystarczy zasłonięcie oczów. Nie potrzebują znaleźć fizycznej kryjówki. W ich kształtującej się jeszcze świadomości doświadczenie ciemności w następstwie zasłonięcia oczów tożsame jest z brakiem ich obecności. Wydaje im się więc, że tym samym nie istnieją dla otoczenia i nie są widoczne dla współtowarzyszy zabawy.

Ciemność jest w umyśle dziecka tożsama z brakiem istnienia. I tak właśnie, jak dobrze pamiętam, wyobrażałem sobie nicość będąc małym chłopcem.

black
Dziecięce wyobrażenie nieistnienia.

Dochodzimy tutaj do kluczowej kwestii. Otóż umysł dziecka w sposób, wydaje się, naturalny dochodzi do koncepcji przejścia pomiędzy nicością a istnieniem, która towarzyszy mu do życia dorosłego. Próba zrozumienia tego zagadnienia stała się źródłem wielu koncepcji metafizycznych, które ukształtowały świat w którym żyjemy. Rozważania te przyczyniły się również do rozwoju myśli naukowej, będąc źródłem zarówno idei filozoficznych jak i inspiracją do badań w obszarze nauk przyrodniczych. Gdzieś z tyły głowy, to właśnie chęć wniknięcia w głębię tego zagadnienia kierowały moimi decyzjami związanymi z podjęciem studiów i później pracą naukową w obszarze fizyki teoretycznej oraz kosmologii.

Trzeba tu podkreślić fakt, że jako ludzie mamy, chociaż bardzo rozwinięte to jednak, ograniczone możliwości poznawcze. Staramy się zrozumieć Przyrodę wykorzystując pojęcia które są przyswajalne dla naszej umysłowości. Wynikają one z naszego doświadczenie i ukształtowane zostały w okresie dorastania. W oparciu o nie budowany jest nasz obraz rzeczywistości. Trzeba sobie jednakże zdawać sprawę z ich ograniczeń. Próba zrozumienia fundamentalnych warstw rzeczywistości wymaga niejako wyjścia poza granicę możliwości percepcji człowieka i posługiwania się nowymi, nie znanymi z życia codziennego, pojęciami. Narzędzi, będących wytworem myśli ludzkiej, umożliwiających wykonanie kroku w przód dostarczają nam matematyka i fizyka.

Przywołane pojęcie “nieistnienia” jest zaś fizyce obce. W świecie fizycznym, różne formy materii i energii mogą podlegać przeobrażeniom – tak zwanym procesom. Kiedy umieramy, atomy z których jesteśmy złożeni nie znikają. Przyjmują natomiast inną formę organizacji. Ponadto, w trakcie naszego życia, atomy te podlegają ciągłej wymianie. Jesteśmy więc procesami nie zaś ustalonymi bytami. Nie zaobserwowano by kiedykolwiek coś fundamentalnie przepadło, czyli przestało istnieć.   Żaden eksperyment nie wykazał również, że cokolwiek pojawiło się w naszym rzeczywistym świecie znikąd, czyli, że (z naszej perspektywy) wcześniej nie istniało. Mamy więc dowód na to, że różne formy energii i materii mogą istnieć. Obserwujemy je. Nie dysponujemy natomiast jakąkolwiek ewidencją tego, że cokolwiek  może “nie istnieć”.  

Czy więc naturalnym stanem rzeczy i w konsekwencji naszego Świata, który się z tych rzeczy składa, jest po prostu istnienie? Chodź wciąż można czuć tutaj pewien dyskomfort, bo przecież, jak to Wszystko po prostu istnieje? Nie musiało się skądś wziąć? Jednakże, rozumiejąc zarówno głębię świata fizycznego jak i będąc świadomym granic naszych zdolności poznawczych, nie jest to dla mnie koncepcja na tyle abstrakcyjna by nie móc jej zaakceptować. Jest uważam racjonalna. To znaczy, przy obecnym stanie wiedzy, jest to punk widzenia ze znanych mi najbardziej minimalistyczny. Nie wymagający odnoszenia się do koncepcji dalekich od weryfikowalnych.

Skoro więc pojecie “nieistnienia” nie ma fundamentalnego charakteru i nikt nigdy nie zaobserwował czegoś co wcześniej nie istniało, w jakim celu posługiwać się takim pojęciem? Z pewnością jest ono wciąż przydatne w codziennej wymianie informacji, gdzie znaczenie tego słowa jest jasne i nie istnieje ryzyko nadużycia. W rozważaniach dotyczących spraw podstawowych, należy się jednak wykazać dużą ostrożnością, gdyż istnieje uzasadnione ryzyko ekstrapolacji tego pojęcia poza obszar jego stosowalności, co niestety wciąż ma miejsce. Co więcej jestem zdania, że posługiwanie się pojęciem „nieistnienia” w kontekście Wszechświata wprowadziło wiele, posługując się eufemizmem, nieporozumień. 

Czym więc zatem jest stan “istnienia”? Jest to rzeczywistość którą uparcie staramy się zrozumieć.  Wiemy jednak, że na przykład fizyka mikroświata (mechanika kwantowa) dopuszcza różne interpretacje tego co możemy nazwać obiektywną rzeczywistością. Szczegółowe omówienie tego zagadnienia wychodzi jednak poza ramy tego eseju.  W skali makroskopowej, za roboczą definicję naszego istnienia możemy zaś przyjąć chociażby fakt czytania tego zdania. 

Rekapitulując, to, że rzeczy istnieją jest faktem empirycznym. Obserwujemy ich obecność zarówno bezpośrednio za pomocą posiadanych przez nas zmysłów jak również pośrednio, wykorzystując różnorakie urządzenia pomiarowe. Energia i materia mogą ulegać przekształceniom, ale nie giną i nie pojawiają się znikąd. Pojawienie się czegoś z niczego nie zostało nigdy zaobserwowane. Daje nam to podstawy do stwierdzenia, że nieistnienie nie istnieje. Samo pojęcie “nieistnienia” pomimo zaś swojej ograniczonej stosowalności, wciąż może być z powodzeniem stosowane w wielu sytuacjach życia codziennego. Rozumiejąc to, nie pozostaje nam nic innego niż zaakceptować fakt istnienia Wszechświata.

© Jakub Mielczarek

“…Nothingness does not exist
No thing has ever become nothing
And nothing has never become something
What is has always been and will always be”

John Frusciante, After the Ending

Kwantowe cienie

Rzucany przez przedmiot cień nie zawsze daje nam właściwe wyobrażenie o naturze oświetlanego obiektu. Dowodzi tego chociażby twórczość duetu artystycznego Tim Noble i Sue Webster, której przykład pozwoliłem sobie zamieścić poniżej.

Real Life Is Rubbish
Tim Noble i Sue Webster Real Life Is Rubbish (2002). Źródło

Przyjrzymy się powyższemu zdjęciu trochę bliżej. Widzimy na nim stertę śmieci które, pod określonym kątem, rzucają cień dwojga ludzi – Twórców instalacji. Jednym z zamysłów Artystów było niewątpliwie to by wprowadzić nasz mózg w zakłopotanie, poprzez dwoistość interpretacji tego co widzimy. Co mianowicie jest pierwotne, czy są to sylwetki ludzi czy też oświetlane przedmioty? Oczywiści z punktu widzenia fizyki sprawa jest prosta, pierwotna jest sterta rupieci, natomiast cień jest wtórny, a ponadto nie jest on obiektem fizycznym. Wchodząc na warstwę czysto artystyczną, Twórcy skłaniają nas więc do interpretowania prawdziwego (fizycznego) życia jako nie wartego więcej niż to co zdołaliśmy wyrzucić. Świat alegorii nie rządzi się jednak prawami fizyki, przez co nieskrępowanie moglibyśmy kontynuować dalej nasze wywody na temat interpretacji i znaczeń. Jest to niewątpliwe zarówno przyjemne ćwiczenie naszej kreatywności oraz intelektualne wyzwanie. Chciałbym jednak żebyśmy, po tej małej rozgrzewce, wykorzystali nasze umysły do zastanowienia się nad tym czy skoro nie jeden cień to może większa ich ilość może nam pozwolić odsłonić naturę obiektu  który te cienie rzuca. Wyobraźmy sobie na przykład, że instalację Real Life Is Rubbish zaczynamy oświetlać pod innymi kątami. Otrzymane cienie nie będą miały już nic wspólnego z sylwetkami ludzi, mogą nie przypominać zupełnie niczego.  Czy istnieje jednak metoda na to by wykorzystując te dwuwymiarowe rzuty zrekonstruować trójwymiarowy kształt sterty śmieci? Okazuje się, że jest to możliwe, chociaż w przypadku nietransparentnych obiektów taka procedura ma swoje istotne ograniczenia. Transparentność przedmiotów zależy jednak w dużym stopniu od długości fali którymi je oświetlimy. Jeśli zamiast światła widzialnego użylibyśmy rentgenowskiego zakresu promieniowania elektromagnetycznego, na podstawie rzucanych przez przedmiot cienieni moglibyśmy zrekonstruować jego trójwymiarowy kształt. Metoda ta nazywa się tomografią i jest powszechnie stosowana w obrazowaniu medycznym.  Bodajże najpopularniejszym jej przykładem jest tomografia komputerowa (CT), pozwalająca dzięki obrazom (cieniom) rentgenowskim, otrzymanym pod różnym kątem, stworzyć trójwymiarowy obraz, na przykład mózgu (film poniżej).

Od strony matematycznej, zasada działania tomografii opiera się na tak zwanej transformacie Radona. Jest to operacja  która na podstawie dwuwymiarowych projekcji (cieni) pozwala odzyskać trójwymiarowy rozkład gęstości obiektu.

Podobną do tomografii komputerowej procedurę rekonstrukcji trójwymiarowego obrazu możemy przeprowadzić również w mikroskali – w świecie kwantowym. Nosi ona nazwę tomografii kwantowej.  Odpowiednikiem rozkładu gęstości jest tu tak zwana funkcja Wignera, którą otrzymujemy ze stanu  kwantowego | \Psi \rangle, lub ogólniej tak zwanej macierzy gęstości, która w przypadku stanów czystych (ang. pure states) może być wyrażona w następujący sposób: \hat{\rho} = | \Psi \rangle \langle \Psi |.  Na przykład, dla cząstki w jednym wymiarze funkcję Wignera W(x,p), gdzie x to położenie a p to pęd możemy zapisać jako

W(x,p) = \frac{1}{\pi \hslash} \int_{-\infty}^{+\infty} \langle x+y | \hat{\rho} | x-y \rangle e^{-2i py/\hslash} dy.

Z uwagi na ścisłą relację pomiędzy funkcją Wignera a macierzą gęstości, poprzez tomografię kwantową rozumiemy zrekonstruowanie, poprzez dokonanie odpowiednich pomiarów “kwantowych cieni” stanu układu kwantowego, jednego z tych dwóch obiektów.  Chciałbym Ci teraz drogi Czytelniku pokazać jak to wygląd w praktyce i w jaki sposób tomografię stanu kwantowego będziesz mogła lub mógł przeprowadzić samodzielnie, nie odchodząc nawet od komputera.  Choć świat kwantowy może Ci się jawić jako zupełnie niedostępny a wykonywanie w nim pomiarów jako coś mało realnego, dzięki rozwojowi technologii kwantowych możemy się dzisiaj do niego całkiem łatwo dostać.  Wszystko za sprawą dostępnego publicznie pięciokubitowego komputera kwantowego firmy IBM, do którego możesz uzyskać dostęp poprzez tę stronę internetową. Jako wstęp do zagadnienia komputerów kwantowych zachęcam Cię do zapoznania się z moim wcześniejszym wpisem Elementary quantum computing.  Zakładając, że jesteś uzbrojona/ny w podstawowe wiadomości dotyczące mechaniki kwantowej, chciałbym przejść do pokazania Ci jak przeprowadzić tomografię stanu kwantowego pojedynczego kubitu, czyli stanu

|\Psi \rangle = \alpha|0\rangle +\beta |1\rangle,

gdzie, \alpha, \beta \in \mathbb{C} (liczby zespolone), a warunek normalizacji stanu kwantowego \langle \Psi | \Psi \rangle = 1 implikuje, że |\alpha|^2+|\beta|^2=1. Kubit jest nośnikiem najmniejszej porcji informacji kwantowej (odpowiednik klasycznego bitu) i od strony matematycznej jest elementem dwuwymiarowej przestrzeni wektorowej nad ciałem liczb zespolonych, czyli tak zwanej przestrzeni Hilberta.

Zanim przejdziemy do przeprowadzenia pomiarów na kubicie wykorzystując komputer kwantowy IBM Q, wprowadźmy najpierw niezbędne podstawy teoretyczne. Po pierwsze, będziemy chcieli zrekonstruować macierz gęstości \hat{\rho}, która w przypadku kubitu jest macierzą 2\times2 i można ją wyrazić jako:

\hat{\rho} = \frac{1}{2} \left( \hat{\mathbb{I}}+ \langle \hat{X}\rangle \hat{X}+ \langle \hat{Y}\rangle \hat{Y}+ \langle \hat{Z}\rangle \hat{Z}    \right) = \frac{1}{2}\left( \hat{\mathbb{I}}+\vec{S}\cdot \vec{\sigma}  \right) =\frac{1}{2} \left( \begin{array}{cc} 1+\langle \hat{Z}\rangle & \langle \hat{X}\rangle-i\langle \hat{Y}\rangle \\ \langle \hat{X}\rangle+i\langle \hat{Y}\rangle   & 1-\langle \hat{Z}\rangle \end{array} \right) .

Powyżej, wprowadziłem operatory \hat{X}, \hat{Y}, \hat{Z}, którym w reprezentacji macierzowej odpowiadają tak zwane macierze Pauliego:

\hat{X} := \sigma_x = \left( \begin{array}{cc} 0 & 1  \\ 1  & 0 \end{array} \right),  \ \  \hat{Y} := \sigma_y = \left( \begin{array}{cc} 0 & -i  \\ i  & 0 \end{array} \right),  \ \ \hat{Z} := \sigma_z = \left( \begin{array}{cc} 1 & 0  \\ 0  & -1 \end{array} \right) ,

składające się na wektor \vec{\sigma} = (\sigma_x,\sigma_y,\sigma_z).  Natomiast,  wektor \vec{S} = (\langle \hat{X}\rangle,\langle \hat{Y}\rangle,\langle \hat{Z}\rangle) złożony jest z wartości średnich które można obliczyć w oparciu o ogólne wyrażenie: \langle \hat{A}\rangle := \text{tr} (\hat{\rho} \hat{A}).

Po drugie, warto w tym momencie wprowadzić użyteczne pojęcie sfery Blocha. Mianowicie, jest to sfera jednostkowa która reprezentuje wszystkie możliwe stany kwantowe kubitu. Każdy punkt na tej sferze to inny stan kwantowy i wskazuje na niego wprowadzony powyżej wektor \vec{S}. Równanie sfery Blocha to więc \vec{S}\cdot \vec{S} = \langle \hat{X}\rangle^2+\langle\hat{Y}\rangle^2+\langle \hat{Z}\rangle^2=1. Warto zaznaczyć, że powyższe równanie sfery jest konsekwencją tego, iż \hat{\rho}=\hat{\rho}^2, co wynika z założenia dotyczącego czystości stanu kwantowego.

Bloch

Sferę Blocha wygodnie sparametryzować poprzez poprzez kąty \phi \in [0, 2 \pi) oraz \theta \in [0, \pi] tak, że stan kwantowy kubitu możemy z ich pomocą zapisać jako

| \Psi \rangle = \cos(\theta/2) |0 \rangle + e^{i \phi} \sin (\theta/2)| 1 \rangle,

gdzie pominięty został nieistotny globalny czynnik fazowy. Tomografia stanu kwantowego kubitu równoważna jest ze znalezieniem składowych wektora \vec{S},  wskazującego na konkretny punk na sferze Blocha. Wektor ten jest obiektem który chcemy zrekonstruować, podobnie jak rozważany wcześniej oświetlany przedmiot. Korzystając z tej analogii, możemy obrazowo powiedzieć, że wektor Blocha \vec{S} “rzuca trzy cienie” będące jego składowymi (rzutami).  Tomografia stanu kwantowego wymaga określenia tych trzech składowych. Jednakże, w przypadku stanów czystych, długość wektora  \vec{S} jest równa jeden (spełnione jest równanie sfery \vec{S}\cdot \vec{S} = \langle \hat{X}\rangle^2+\langle\hat{Y}\rangle^2+\langle \hat{Z}\rangle^2=1) co wprowadza relację pomiędzy “cieniami”. W takim przypadku, wystarczy zmierzyć jedynie dwie spośród wszystkich trzech składowych. Trzeci rzut możemy zaś wyznaczyć z równania sfery Blocha.  Z uwagi na to, że w przypadku ogólnym, stan kwantowy poprzez jego oddziaływanie ze środowiskiem może nie być do końca czysty (staje się tak zwanym stanem mieszanym) zasadne jest by z góry nie dokonywać założenia o czystości stanu kwantowego.

Komputer kwantowy IBM, pracujący w oparciu  o tak zwane kubity nadprzewodzące, pozwala nam wykonać pomiary w bazie własnej operatora \hat{Z}.  Wielokrotne powtórzenie pomiarów w takiej bazie, dla każdorazowo przygotowanego na nowo takiego samego stanu kwantowego, pozwala wyznaczyć wartość średnią operatora \hat{Z} w tym stanie. Mianowicie, ponieważ \hat{Z}|0\rangle = |0\rangle oraz  \hat{Z} |1\rangle = -|1\rangle, otrzymujemy

\langle \hat{Z} \rangle = (\alpha^* \langle 0| +\beta^* \langle 1|)(\alpha|0\rangle -\beta |1\rangle) = |\alpha|^2-|\beta|^2 = P(0)-P(1),

gdzie wykorzystaliśmy ortonormalność stanów bazowych |0\rangle i |1\rangle. Poszukiwana średnia jest więc różnicą pomiędzy prawdopodobieństwami znalezienia układu w stanie |0\rangle a w stanie  |1\rangle. Wyznaczenie średnich \langle \hat{X} \rangle  oraz \langle \hat{Y} \rangle, niezbędnych do przeprowadzenia tomografii, nie jest już takie bezpośrednie. Należy mianowicie dokonać pomiarów w bazach własnych operatorów \hat{X}   oraz \hat{Y}. Jak pokażemy poniżej, można tego dokonać dokonując odpowiednich transformacji badanego stanu kwantowego.  Do tego celu będą nam pomocne dodatkowe operatory:

\hat{H} = \frac{1}{\sqrt{2}} \left( \begin{array}{cc} 1 & 1  \\ 1  & -1 \end{array} \right), \ \ \  \hat{S} = \left( \begin{array}{cc} 1 & 0  \\ 0  & i \end{array} \right), \ \ \  \hat{S}^{\dagger} = \left( \begin{array}{cc} 1 & 0  \\ 0  & -i \end{array} \right) ,

pierwszy z nich to tak zwany operator Hadamarda, stowarzyszona z nim tak zwana bramka Hadamarda jest ważnym elementem w konstrukcji obwodów kwantowych. Operator \hat{S} to natomiast operator obrotu fazy o 90 stopni, natomiast \hat{S}^{\dagger} to jego sprzężenie hermitowskie.

Ponieważ jesteśmy już blisko momentu w którym zaczniemy dokonywać konkretnych pomiarów, zdecydujmy się na wybór stanu kwantowego który będziemy chcieli poddać tomografii. Mój wybór padł na stan:

| \Psi \rangle = \hat{T} \hat{H} | 0 \rangle = \frac{1}{\sqrt{2}} \left( | 0 \rangle + e^{i \frac{\pi}{4}} | 1 \rangle  \right),

dla którego wektor Blocha wskazuje, pod kątem \phi = 45^{\circ}, na punkt na  równiku na sferze Blocha. Natomiast, Ciebie drogi Czytelniku, po przeanalizowaniu poniższego przykładu,  zachęcam do eksperymentowania z wybranymi przez Ciebie stanami kwantowymi. Dodam jeszcze, że powyżej wykorzystałem operator \hat{T} zdefiniowany jest w następujący sposób:

\hat{T} := \sqrt{\hat{S}}=\left( \begin{array}{cc} 1 & 0  \\ 0  & e^{i \frac{\pi}{4}} \end{array} \right).

Dla wybranego przeze mnie stanu kwantowego, macierz gęstości przybiera postać:

\hat{\rho}_1 = \frac{1}{2} \left( \begin{array}{cc} 1 & \frac{1}{\sqrt{2}}-\frac{i}{\sqrt{2}}  \\  \frac{1}{\sqrt{2}}+ \frac{i}{\sqrt{2}}   & 1 \end{array} \right) .

Sprawdzenie tego pozostawiam jako zadanie dla Ciebie. Porównują elementy tej macierzy z wprowadzoną na wstępie ogólną postacią macierzy gęstości dla kubitu możemy odczytać, że wartości operatorów \hat{X}, \hat{Y}, \hat{Y} mają w tym stanie następujące wartości:

\langle \hat{X} \rangle = \frac{1}{\sqrt{2}},  \ \ \langle \hat{Y} \rangle = \frac{1}{\sqrt{2}}, \ \  \langle \hat{Z} \rangle = 0.

Przekonajmy się teraz na ile te przewidywania teoretyczne zgadzają się z pomiarami otrzymanymi w komputerze kwantowym charakteryzującym się błędami zarówno bramek kwantowych oraz odczytu jaki i wynikającymi z tak zwanej dekoherencji kwantowej, wprowadzającej mieszanie stanu kwantowego.

Pomiar \langle \hat{Z} \rangle

Poniżej, przedstawiono obwód kwantowy umożliwiający wytworzenie stanu | \Psi \rangle = \hat{T} \hat{H} | 0 \rangle = \frac{1}{\sqrt{2}} \left( | 0 \rangle + e^{i \frac{\pi}{4}} | 1 \rangle  \right), oraz wykonanie na nim pomiarów w bazie \{|0\rangle, |1 \rangle \}. Obwód taki możemy łatwo zbudować korzystając z kreatora dostępnego na stronie IBM Experience.

Tom-ZPowtarzając powyższy algorytm 1024 razy otrzymaliśmy  P(0)=0.567 oraz  P(1)=0.433, co pozwala wyznaczyć \langle \hat{Z} \rangle = P(0)-P(1)=0.134. Niepewność tego wyniku ma dwa źródła. Pierwsze jest związane z błędami instrumentalnymi pochodzącymi od błędów bramek, będącymi na poziomie 0.001 na bramkę jedno-kubitową, oraz błędami odczytu, który jest na poziomie 0.08. Drugie źródło niepewności jest związane ze statystyczną naturą mechaniki kwantowej. W  rozważanej sytuacji spodziewamy się, że z jednakowym prawdopodobieństwem będziemy otrzymywać jako wynik pomiaru stany |0\rangle oraz  |1\rangle. Zagadnienie oszacowania odpowiednich niepewności jest matematycznie równoważne do przypadku błądzenia przypadkowego w jednym wymiarze. Jeśli przez N_0 oznaczymy ilość wyników  |0\rangle a przez N_1 ilość wyników dla |1\rangle, tak, że N_0+N_1=N=1024, to odchylenie standardowe N_0 i N_1 wyniesie s=\sqrt{N/4}=16. Stąd, możemy wyznaczyć niepewność estymacji prawdopodobieństwa, wynikającą ze statystycznej natury mechaniki kwantowej na s/N = 1/\sqrt{4N} \approx 0.016. Sumaryczną niepewność pomiaru możemy więc określić na około 0.1, czyli około 10 \%.  Otrzymane wyniki, dla P(0) oraz P(1), są w granicach tej niepewności zgodne z teoretycznie przewidywanymi  wartościami.

Pomiar \langle \hat{X} \rangle

Wykonanie pomiaru wartości średniej \langle \hat{X} \rangle wymaga obrócenia układu tak żeby ustawić kierunek X wzdłuż osi Z. Można tego dokonać dzięki poniższej relacji operatorowej

\hat{X} = \hat{H} \hat{Z} \hat{H},

którą łatwo dowieść wykorzystując reprezentację macierzową zaangażowanych tu operatorów. Na tej podstawie, wartość średnią operatora \hat{X} w  stanie  |\Psi \rangle możemy wyrazić jako

\langle \hat{X} \rangle = \langle \Psi | \hat{X} |\Psi \rangle = (\langle \Psi | \hat{H}) \hat{Z} (\hat{H}|\Psi \rangle) .

Żeby więc obliczyć wartość  \langle \hat{X} \rangle należy na stan  |\Psi \rangle zadziałać operatorem \hat{H}, po czym wystarczy dokonać pomiarów w bazie operatora \hat{Z}. Ilustruje to poniższy obwód kwantowy:

Tom-XWykonując 1024 pomiary, zupełnie tak samo jak w przypadku \langle \hat{Z} \rangle, otrzymujemy  P(0)=0.870, P(1)=0.130, co pozwala nam wyznaczyć \langle \hat{X} \rangle = P(0)-P(1)=0.740. Rozważania dotyczące niepewności pomiaru są analogiczne jak w przypadku wyznaczania  \langle \hat{Z} \rangle.

Pomiar \langle \hat{Y} \rangle

Podobnie jak w przypadku pomiaru \langle \hat{X} \rangle, również wyznaczenie wartości średniej operatora \hat{Y} może zostać wykonana poprzez odpowiednią transformację stanu kwantowego. W tym przypadku, należy wykorzystać transformację:

\hat{Y} = (\hat{S} \hat{H}) \hat{Z}(\hat{S} \hat{H})^{\dagger} = (\hat{S} \hat{H}) \hat{Z}(\hat{H} \hat{S}^{\dagger}),

(udowodnij tę relację) na której podstawie:

\langle \hat{Y} \rangle = \langle \Psi | \hat{Y} |\Psi \rangle = (\langle \Psi | \hat{S} \hat{H}) \hat{Z} (\hat{H} \hat{S}^{\dagger}|\Psi \rangle).

W celu wyznaczenia wartość średniej \langle \hat{Y} \rangle musimy więc na otrzymany stan zadziałań najpierw operatorem \hat{S}^{\dagger}, następnie operatorem \hat{H}, po czym dokonać pomiarów w bazie operatora \hat{Z}, jak to przedstawiono na obwodzie poniżej:

Tom-Y

Stąd, postępując analogicznie jak w poprzednich przypadkach, otrzymujemy P(0)=0.837, P(1)=0.163, a to pozwala nam wyznaczyć  \langle \hat{Y} \rangle = P(0)-P(1)=0.674. Czym kończymy nasze pomiary. Pozostaje nam pozbierać otrzymane wyniki.

Zbierając wszystko razem  

Zbierając powyższe wyniki, otrzymujemy następujący wektor Blocha:

\vec{S} = (\langle \hat{X}\rangle,\langle \hat{Y}\rangle,\langle \hat{Z}\rangle) =  (0.740,0.674,0.134),

którego kwadrat modułu \vec{S}\cdot \vec{S} \approx 1.02 co jest, w granicach błędu, zgodne z przypadkiem stanu czystego. Natomiast, otrzymana w wyniku przeprowadzonej tomografii macierz gęstości to

\hat{\rho}_2 = \frac{1}{2} \left(\begin{array}{cc} 1.134  & 0.740-i 0.674 \\ 0.740+i 0.674  & 0.866 \end{array} \right) .

Powszechnie stosowaną metodą ilościowego określenia zgodności dokonanej tomografii z wartością teoretyczną jest wyznaczenie tak zwanej wierności (ang. fidelity) zdefiniowanej w następujący sposób:

F(\hat{\rho}_1,\hat{\rho}_2):= \text{tr}\sqrt{\sqrt{\hat{\rho}_1}\hat{\rho}_2 \sqrt{\hat{\rho}_1}} .

Stosując powyższe wyrażenia do teoretycznie przewidzianej macierzy gęstości \rho_1 oraz macierzy gęstości otrzymanej w wyniku procedury tomografii \rho_2, otrzymujemy wartość F(\hat{\rho}_1,\hat{\rho}_2) \approx 99.996 \%. Wierność zrekonstruowanego kwantowego tomogramu jest więc bardzo wysoka, co jest jednak zgodne z oczekiwaniami dla pojedynczego kubitu. W przypadku tomografii przeprowadzonej dla większej ilości kubitów, wierność odwzorowania będzie odpowiednio niższa. O ile niższa? To już zależy od konkretnego stanu kwantowego. Jeśli masz ochotę na dalsze ambitniejsze wyzwanie, zachęcam Cię do przeprowadzenia tomografii jednego ze splątanych stanów Bella. Stany te odgrywają dużą rolę zarówno w obliczeniach kwantowych jak i w teleportacji kwantowej oraz kwantowej kryptografii (np. protokół Ekerta). W zastosowaniach tych, przygotowanie stanu kwantowego o odpowiednio wysokiej wierności ma znaczenie praktyczne i uzależnione jest od tego na przykład bezpieczeństwo zaszyfrowanej kwantowo informacji. Przyglądając się uważnie “kwantowym cieniom” stanu Bella możemy zdiagnozować czy jest on wystarczajaco “zdrowy” do wykonania powierzonego mu zadania.

© Jakub Mielczarek

Elementary quantum computing

For theoretical physicists, programming quantum computers sounds like one of the easiest things to do. It is just playing with tensor products of two-dimensional Hilbert spaces and constructing certain unitary operators. However, we are not such common species and some other people would also like to learn a bit more about quantum computing as well.  Therefore, here I will show what the basics of quantum computing are.  My approach is to present a very simple example of how to construct a quantum circuit and execute it on a real quantum computer. Namely, we will use publicly available IMB Q Experience  platform to generate one of the so-called Bell states:

| B \rangle = \frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right).

This state has quite interesting physical interpretation. It represents maximally entangled state of two spin 1/2 particles (e.g. two electrons) such that the total spin of the system is equal zero (such states are known as singlets). The | B \rangle state is relevant in both quantum computing and quantum cryptography. So, let us begin…

howtomeasure
Picture of the IBM quantum chip composed of 7 superconducting qubits. Source

A single qubit is a state (vector) | \Psi \rangle  in two-dimensional Hilbert space, which we denote as \mathcal{H}. Let us choose the space to be spanned by two orthonormal basis states |0\rangle and |1\rangle such that \langle 1|0\rangle =0 and \langle 0|0\rangle = 1 = \langle 1|1\rangle . A general qubit is a superposition of the basis states:

| \Psi \rangle = \alpha|0\rangle +\beta |1\rangle ,

where, \alpha, \beta \in \mathbb{C} (complex numbers), and the normalization condition \langle \Psi | \Psi \rangle = 1 implies that |\alpha|^2+|\beta|^2=1.

There are different quantum operators (gates) which may act on the quantum state | \Psi \rangle. For instance, the so-called bit-flip operator \hat{X} which  transforms  |0\rangle into  |1\rangle and  |1\rangle into  |0\rangle  (\hat{X}|0\rangle =|1\rangle and \hat{X}|1\rangle =|0\rangle) can be introduced. Another important operator is the Hadamard operator \hat{H} which is defined by the following action on the qubit basis states:

\hat{H}|0\rangle =\frac{1}{\sqrt{2}}\left(|0\rangle  +|1\rangle\right)  and  \hat{H}|1\rangle =\frac{1}{\sqrt{2}}\left(|0\rangle  -|1\rangle\right).

The above are examples of operators acting on a single qubit. However, while considering quantum computing we usually deal with quantum register composed of N qubits.  The resulting quantum state belongs to Hilbert space being a tensor product of N copies of the qubit Hilbert space:

\underbrace{\mathcal{H}\otimes\mathcal{H}\otimes \dots \otimes\mathcal{H}}_{N},

dimension of which is

\text{dim}(\underbrace{\mathcal{H}\otimes\mathcal{H}\otimes \dots \otimes\mathcal{H}}_{N})=2^N.

This exponential growth with N is the main obstacle behind simulating quantum systems on classical computers. With the present most powerful classical supercomputers we can simulate quantum systems with {\bf N=56} at most. The difficulty is due to the fact that quantum operators acting on 2^N dimensional Hilbert space are represented by 2^N\times2^N matrices, which are very difficult to deal with when N is roughly more than 50 (for N=56, 2^{56} \sim 10^{17}).  

A quantum algorithm is simply a unitary operator \hat{U} acting on the initial state of N quibits |0\rangle\otimes|0\rangle \otimes \dots \otimes|0\rangle \in\mathcal{H}\otimes\mathcal{H}\otimes \dots \otimes\mathcal{H}. The outcome of the quantum algorithm is obtained by performing measurements on the final sate: \hat{U}(|0\rangle\otimes|0\rangle \otimes \dots \otimes|0\rangle). Because of the probabilistic nature of quantum mechanics, the procedure has to be performed repeatedly in order to reconstruct the final state.

The unitary operator \hat{U} can be decomposed into elementary operators called quantum gates, similarly to the logical electronic circuits which are built out of elementary logic gates.  The already introduced \hat{X} and \hat{H} operators are examples of gates acting on a single qubit. However, the gates may also act on two or more qubits. An example of 2-qubit gate relevant for our purpose is the so-called CNOT gate, which we denote as \hat{C}.  The operator is acting on 2-qubit state |ab\rangle \equiv |a\rangle \otimes|b\rangle, where |a\rangle and |b \rangle are single quibit states. Action of the CNOT operator on the basis states can be expressed as follows:

\hat{C}(|a\rangle \otimes|b\rangle) =|a\rangle \otimes|a\oplus b\rangle,

where a,b \in \{0,1\}.  The \oplus is the XOR (exclusive or) logical operation (or equivalently addition modulo 2), defined as 0\oplus 0 = 0,  0\oplus 1 = 11\oplus 0 = 1 and 1\oplus 1 = 0. In consequence:

\hat{C}|00\rangle =|00\rangle,   \hat{C}|01\rangle =|01\rangle,   \hat{C}|10\rangle =|11\rangle,   \hat{C}|11\rangle =|10\rangle.

We are now equipped to address the initial task of creating the Bell state  | B \rangle = \frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right). We will perform it in the following steps:

  1. We begin with the initial 2-qubit state  |00\rangle \equiv |0\rangle\otimes|0\rangle.
  2.  Then, we are acting on both qubits with the spin-flip operator \hat{X}. The corresponding operator has a form of the following tensor product: \hat{X}\otimes \hat{X} . Action of this operator on the initial state gives:  (\hat{X}\otimes \hat{X})(|0\rangle\otimes|0\rangle ) =(\hat{X}|0\rangle\otimes\hat{X}|0\rangle)=|1\rangle\otimes|1\rangle \equiv |11\rangle.
  3. Now, let us act on the first quibit with the Hadamard operator (gate), leaving the second qubit unchanged. Such operation is represented by the operator \hat{H}\otimes\hat{I}, where \hat{I} is the identity operator which does not change a quantum state. Action of \hat{H}\otimes\hat{I} on |11\rangle gives \frac{1}{\sqrt{2}}(|0\rangle  -|1\rangle)\otimes |1 \rangle = \frac{1}{\sqrt{2}}|01\rangle-\frac{1}{\sqrt{2}}|11\rangle .
  4. In the final step we are acting on the obtained state with the CNOT gate: \hat{C}(\frac{1}{\sqrt{2}}|01\rangle-\frac{1}{\sqrt{2}}|11\rangle )=\frac{1}{\sqrt{2}}\hat{C}|01\rangle-\frac{1}{\sqrt{2}}\hat{C}|11\rangle =\frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right), getting the Bell state.

The total unitary operator representing our quantum algorithm can be written as a composition of the elementary steps:

\hat{U} =\hat{C}(\hat{H} \otimes \hat{I} )(\hat{X} \otimes \hat{X}).

Action of this operator on the initial state |00\rangle gives the state | B \rangle:

\hat{U}|00\rangle =\frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right).

In the experimental part we will create the Bell state employing publicly accessible 5-qubit quantum computer provided by IBM. In the quantum device, qubits are constructed using superconducting circuits, operating at millikelvin temperatures. Access to the device can be obtained through this link (you have to create a free account and login).

IBMQ5

The quantum circuit representing the operator \hat{U} can  now be created using the quantum gates in the online quantum composer. The quantum circuit should look as follows (we used the last two qubits here):

Algorithm

The green boxes with letter X represent the bit-flip gates, the blue box with letter H represents the Hadamard gate, while the next operation from the left is the CNOT gate acting on both qubits. Finally, the pink boxes represent measurements performed on the final state. Restricting to the last two qubits,  the final state can be expressed as the following superposition:

|\Psi \rangle =c_1|00\rangle+c_2|01\rangle+c_3|10\rangle+c_4|11\rangle,

where c_1, c_2, c_3, c_4 \in \mathbb{C} and |c_1|^2+| c_2|^2+|c_3|^2+ |c_4|^2=1. What is measured are probabilities of the basis states P(i) = |c_i|^2, where i=1,2,3,4.  For the Bell state | B \rangle we expect that

P(1) = 0,   P(2) = \frac{1}{2}P(3) = \frac{1}{2} and P(4) = 0.

However, in the real experiment (because of the finite number of measurements as well as due to the quantum errors) the obtained results might differ. Let us firstly check what are the probabilities obtained by running the algorithm on the simulator of quantum computer provided by IBM. By executing the algorithm 1000 times we obtain the following result:

P(1) = 0,   P(2) = 0.515P(3) = 0.485 and P(4) = 0.

Simulator

The result is in high compliance with the theoretical predictions. Finally, running the true quantum computer IBM Q 5 Tenerife (performing 1024 runs) we obtained:

P(1) = 0.104,   P(2) = 0.503P(3) = 0.368 and P(4) = 0.024.

Tenerife

Presence of the undesirable contributions from the states |00\rangle and |11\rangle is due to the errors of the quantum gates, which are still quite significant. Reduction of this error is crucial for the future utility of quantum computers.

This introduction is of course only the beginning of the story. If you find the subject interesting let me recommend you some further reading and watching:

  1. Artur Ekert, Patrick Hayden, Hitoshi Inamori, Basic concepts in quantum computation [arXiv:quant-ph/0011013].
  2. IBM Q experience Documentation, User Guide.
  3. Quantum software, Nature, Insight, 
  4. https://www.youtube.com/watch?v=JRIPV0dPAd4&t=959s

 

© Jakub Mielczarek

Kryptowaluty-Kwanty-Kosmos

Świat zachłysnął się cyfrowym złotem – kryptowalutami. Bitcoin i technologia Blockchain stały się, w mgnieniu oka, częścią naszej codzienności. Choć jeszcze dosłownie kilka lat temu były to nazwy znane głównie entuzjastom nowych technologii oraz postępowym inwestorom. Obecnie, zainteresowanie rynkiem kryptowalut jest ogromne,   a sięgające nawet kilkuset procent w skali roku wzrosty kursów kryptowalut wabią  okazją zbicia fortuny.

Nie mniej emocji dostarcza nam obecny renesans w eksploracji kosmosu (tzw. NewSpace). Takie momenty jak symultaniczne lądowanie odzyskiwanych po stracie rakiety Falcon Heavy stopni pomocniczych to sceny niczym z filmów science fiction. Spektakularność tych wyczynów pobudza wyobraźnię nie tylko pasjonatów kosmosu, ale i inwestorów, przyśpieszając otwarcie przestrzeni kosmicznej dla coraz ambitniejszych wyzwań. Trochę w cieniu Blockchainu i NewSpace, rozgrywa się obecnie jeszcze jedna niezwykle ważna technologiczna rewolucja, nie robiąca może tyle huku co start rakiety ani nie hipnotyzująca tak jak cyfrowe złoto, ale za to gruntownie transformująca informacyjną tkankę naszego świata. Chodzi mianowicie o przeskok od obecnej fazy przetwarzania informacji klasycznej (bity) do epoki informacji kwantowej (qubity).  Nowe technologie kwantowe, bo za ich sprawą  ma to miejsce, wpłyną na dalszy rozwój zarówno kryptowalut jak i technologii kosmicznych. Możemy sformułować nawet śmielszą tezę: rozwiązania, które zrodzą się na przecięciu tych trzech obszarów (kryptowalut, technologii kwantowych i eksploracji kosmosu), zrewolucjonizują każdy z nich z osobna jak i wygenerują zupełnie nową jakość.

Ale po kolei. Kryptowaluty opierają się na rozproszonym systemie księgowym typu peer-to-peer, zaproponowanym w artykule Bitcoin: A Peer-to-Peer Electronic Cash System. W rozwiązaniu takim, w przeciwieństwie do standardowych systemów finansowych, nie istnieje centralny podmiot autoryzujący, np. bank. Poprawność obrotu kryptowalutą zapewniona jest natomiast poprzez decentralizację oraz szereg zabezpieczeń kryptograficznych. Należy do nich, w szczególności, podpis elektroniczny za pomocą którego składane są dyspozycje transakcji.  Jest to przykład tak zwanej kryptografii asymetrycznej, w której istnieją dwa typy klucza: prywatny oraz publiczny. Wykonanie transakcji wiąże się z podpisaniem, za pomocą klucza prywatnego, dyspozycji transakcji  i następnie jej autoryzowanie przez innych użytkowników sieci, na postawie znajomości klucza publicznego. Dokładnie tak samo jak w przypadku składania podpisu elektronicznego. Siła takiego zabezpieczenia opiera się na dużej złożoności obliczeniowej związanej z odtworzeniem postaci klucza prywatnego na podstawie znajomości klucza publicznego.  W przypadku Bitcoina, wykorzystywany jest w tym celu algorytm ECDSA (Elliptic Curve Digital Signature Algorithm). Jest on odporny na ataki prowadzone przez komputery klasyczne. Natomiast, okazuje się, że dla uniwersalnych komputerów kwantowych problem ten przestaje być aż tak trudny. Mianowicie, do znalezienia klucza prywatnego (w kryptografii bazującej na ECDSA) możliwe jest zastosowanie zmodyfikowanego kwantowego algorytmu faktoryzacji Shora. Niedawna publikacja Quantum attacks on Bitcoin, and how to protect against them sugeruje, że postęp w rozwoju komputerów kwantowych może umożliwić łamanie obecnych zabezpieczeń opartych o ECDSA już za niespełna 10 lat.

Utrzymanie zdecentralizowanej struktury Blockchainu, na której opary jest Bitcoin, wymaga pracy tak zwanych górników (minerów). Zapłatą za wkład ich mocy obliczeniowej w utrzymywanie systemu są Bitcoiny. Żeby jednak je otrzymać, należy rozwiązać zadanie oparte o tak zwaną funkcję haszującą SHA-256, opracowaną przez National Security Agency. W celu rozwiązania zadania, konieczne jest zbadanie wartość funkcji haszujacej dla bardzo dużej ilości różnych wartości jej argumentu. Jest to, dla komputerów klasycznych, niezwykle żmudne zadanie (energia elektryczna przeznaczana obecnie na tę czynność, tylko w przypadku Bitcoinu, wynosi w skali roku ponad 70 TWh, co jest porównywalne z konsumpcją energii elektrycznej Austrii). Okazuje się jednak, że zadanie to jest jednym z tych z którymi doskonale radzą sobie algorytmy kwantowe. Otóż, można w tym przypadku wykorzystać jeden z najbardziej znanych algorytmów kwantowych, tak zwany algorytm Grovera. Pozwala on zredukować złożoność obliczeniową procesu poszukiwania argumentu funkcji haszującej do pierwiastka kwadratowego z liczby dozwolonych argumentów.

Możemy  więc dojść do wniosku, że rozwój technologii kwantowych, w szczególności uniwersalnych komputerów kwantowych (takich jak np. IBM Q), stanowi zagrożenie dla zabezpieczeń na których opierają się obecne kryptowaluty. Z drugiej strony jednak, technologie kwantowe pozwalają również ulepszyć systemy takie jak Blockchain. Miedzy innymi,  klasyczne zabezpieczenia kryptograficzne mogą zostać zastąpione przez odpowiednie rozwiązania kryptografii kwantowej.  Do najważniejszych z nich należą: kwantowe generatory kluczy oraz tak zwana Kwantowa Dystrybucja Klucza (KDK).

KDK opiera się na takich własnościach mechaniki kwantowej jak zaburzenie stanu układu kwantowego poprzez pomiar i tak zwany zakaz klonowania stanów kwantowych.  Na tej podstawie, protokoły kwantowej dystrybucji klucza są w stanie wykryć każdą próbę wykradzenia informacji. Stanowią więc wręcz idealną metodę zabezpieczenia wymiany klucza prywatnego, eliminując tym samym potrzebę stosowania kryptografii asymetrycznej.  Warto podkreślić, że KDK osiągnęła poziom technologii dostępnej komercyjnie. Jednakże, jej stosowanie na dużych odległościach (rzędu kilkuset kilometrów) wciąż stanowi wyzwanie. Wiąże się to z koniecznością przesyłania pojedynczych fotów, w których stanach kwantowych zakodowany jest klucz prywatny. Można w tym celu zastosować światłowód. Nie jest to jednak rozwiązanie optymalne gdyż, z uwagi na zakaz klonowania stanów kwantowych, wzmacnianie sygnału przesyłanego tą drogą jest trudnym zadaniem. Żeby zniwelować straty w przesyłanym sygnale, niezbędne jest zastosowanie tak zwanych kwantowych powielaczy, realizujących protokół teleportacji kwantowej. Z uwagi na złożoność techniczną takiego rozwiązania, dużo łatwiejsze okazuje się przesyłanie pojedynczych fotonów w powietrzu lub w próżni. W konsekwencji, jedyny dostępny dzisiaj sposób przeprowadzania kwantowej dystrybucji klucza na odległościach międzykontynentalnych opiera się na wykorzystaniu przestrzeni kosmicznej.

Prace nad takim rozwiązaniem prowadzono już od dłuższego czasu. Ostatecznie, udało się tego dokonać w ubiegłym roku przez chińsko-austriacki zespół naukowców i inżynierów. Wyniki przeprowadzonej na dystansie 7600 km, pomiędzy stacjami w Chinach i Austrii, kwantowej dystrybucji klucza opublikowano w styczniu bieżącego roku na łamach Physical Review Letters [arXiv:1801.04418]. Do zrealizowania kwantowej transmisji wykorzystano satelitę Micius, stanowiącą jednostkę zaufaną dystrybuującą klucz prywatny w protokole BB84 (Bennett-Brassard 1984).  Szczegóły tego eksperymentu omawiam w artykule Kwantowa łączność satelitarna

Sukces chińskiego projektu dowodzi możliwości globalnego wykorzystania kwantowych protokołów kryptograficznych.  Otwiera on również drogę do dalszego rozwoju tej technologii, zarówno do celów militarnych jak i komercyjnych. Jedną z niewątpliwie najbardziej fascynujących możliwości jest stworzenie tak zwanego kwantowego internetu

Kwantowy internet zapewni bezpieczeństwo pracy systemów finansowych. W szczególności, umożliwi rozszerzenie technologii  Blockchain do przypadku kwantowego (zabezpieczanego przez KDK). Propozycja takiej modyfikacji technologii Blockchain została niedawno opisana w artykule Quantum-secured blockchain. Internet kwantowy umożliwi również wdrożenie pochodnych do dyskutowanych już na początku lat osiemdziesiątych koncepcji kwantowego pieniądza.  W szczególności, takich jak propozycja Weisnera, w której pieniądz jest pewnym stanem kwantowym (np. sekwencją qubitów). Niepodrabialność kwantowego banknotu wynika wprost z zakazu klonowania (nieznanego) stanu kwantowego. Warto zaznaczyć, że realizacja kwantowego pieniądza opartego o propozycję Weisnera została doświadczalnie zademonstrowana w 2016-tym roku przez polsko-czeski zespół fizyków kwantowych i opisana w artykule Experimental quantum forgery of quantum optical moneyopublikowanym w Nature.  Po więcej informacji na temat kwantowych pieniędzy zachęcam sięgnąć do artykułu Quantum Money.

Quantum-banknote
Kwantowy banknot Weisnera zawierający nieznany użytkownikowi stan kwantowy (np. sekwencja qubitów) oraz numer seryjny. Weryfikacja banknotu (zgodność stanu kwantowego z nadanym numerem seryjnym) następuje poprzez jego przesłanie do  instytucji emitującej (mennicy). Źródło

Kwantowo zabezpieczone kryptowaluty czy też kwantowe pieniądze będą mogły, dzięki satelitarnemu internetowi kwantowemu, tworzyć globalny system walutowy. Dzięki wykorzystaniu i tak już stosowanej do tego celu przestrzeni kosmicznej, nie będzie stanowiło żadnego problemu by rozszerzyć obszar obejmowany kwantową siecią poza powierzchnię Ziemi. Nie ma przecież lepszego medium do przesyłania stanów kwantowych niż próżnia.  

Ludzie przebywający w kosmosie, czy to na orbicie okołoziemskiej czy też w planowanych stacjach na Księżycu oraz na Marsie, będą mogli dokonywać płatności korzystając z kwantowo zabezpieczonych kryptowalut. Będą oni mogli korzystać również z pozafinansowych zastosowań kwantowej wersji technologii Blockchain, np. w telemedycynie. 

Od strony możliwości technicznych, takie wizje stają się dzisiaj jak najbardziej wykonalne. Idąc dalej, naturalnym wydaje się wykorzystanie w przyszłości przestrzeni kosmicznej jako miejsca do przechowywania i przetwarzania informacji kwantowej. Stany kwantowe, będące nośnikiem informacji kwantowej ulegają, poprzez oddziaływanie ze środowiskiem, dekoherencji która stanowi jedną z największych przeszkód w rozwoju technologii kwantowych. Warunki wysokiej próżni i niskich temperatur, redukujące proces dekoherencji, powszechnie występują w przestrzeni kosmicznej.  Z tego powodu, możliwe jest więc, że przyszłe centra przetwarzania i magazynowania informacji kwantowej, np. skarbce kwantowych pieniędzy, będą ulokowane nie na Ziemi lecz ukryte zostaną w takich miejscach jak jaskinie lawowe na Księżycu.   

© Jakub Mielczarek

Rock et Science

Fundamentem każdej odpowiednio zaawansowanej technologii są nauki podstawowe. Niestety jednak, umiejętność posługiwania się nowymi zdobyczami techniki powszechnie nie idzie w parze ze zrozumieniem zasad ich funkcjonowania. I nie chodzi mi tu o szczegóły techniczne danego urządzenia, znajomość tych jest przeciętnemu użytkownikowi zbyteczna, lecz o ideę, na której dane rozwiązanie się opiera. A to uważam jest istotne, chociażby po to, by we współczesnym technologicznym świecie nie czuć się zdezorientowanym i móc w pełni czerpać z jego dobrodziejstw. Dla przykładu, tak prosta rzecz jak żarówka. Przez lata, intuicyjne rozumienie jej działania nie stanowiło dla nikogo większego problemu. Jednakże dzisiaj, “żarówka”  to już najczęściej nie lampa żarowa lecz lampa LED.  Bez wątpienia, odsetek osób rozumiejących zasadę emisji światła z lampy LED (rekombinacja promienista par elektron-dziura w półprzewodnikowym złączu p-n) jest dużo niższy niż to miało miejsce w przypadku standardowych lamp żarowych (promieniowanie termiczne rozgrzanej przez przepływ prądu skrętki).

To właśnie chęć przyczynienia się do zmiany tego stanu rzeczy była jednym z zamysłów które skłoniły mnie do podjęcia się prowadzenia tego bloga. Wyszedłem z założenia, iż sytuację tę można niejako obrócić na korzyść nauk podstawowych. Bo przecież, chęć (czy też potrzeba) zrozumienia otaczających nas technologii stanowi doskonały punkt wyjścia do głębszej refleksji nad zasadami stojącymi za ich funkcjonowaniem. W ten sposób, możemy dzisiaj stosunkowo łatwo dotrzeć do fundamentalnych koncepcji naukowych oraz praw natury, których przyswojenie, bez technologicznego kontekstu byłoby znacznie trudniejsze i dla wielu z nas mniej ciekawe.  W części z moich kolejnych wpisów będę starał się podążać tą ścieżką, biorąc “na warsztat”  nowoczesne technologie i odsłaniając ich naukowy rdzeń.

Jednymi z tych technologii które powszechnie uważane są szczególnie trudne, są technologie rakietowe. Inżynierię rakietową (ang. rocket science) przyjęło się wręcz traktować jako synonim czegoś niezwykle skomplikowanego. Wbrew tej opinii, podstawy fizyczne działania rakiet są stosunkowo proste.

Ponieważ żyjemy w czasach niezwykłego ożywienia w obszarze eksploracji kosmosu (tzw. NewSpace) a media zalewają nas doniesieniami o startach nowych rakiet, eksploracji Marsa i nadchodzącej erze turystyki kosmicznej, podstawy rocket science najzwyczajniej warto znać. Wychodząc naprzeciw tej potrzebie, poniżej, postaram się podsumować najistotniejsze aspekty fizyczne działania rakiet. Swoją uwagę skoncentruję tutaj na najpopularniejszym typie rakiet kosmicznych, wykorzystującym chemiczne silniki rakietowe.

W największym uproszczeniu, rakieta porusza dzięki wyrzucanym z silnika rakietowego gazom spalinowym. Działa tu efekt odrzutu, będący konsekwencją zasady zachowania pędu. Rakieta zyskuje pęd równy co do wartości i kierunku, lecz o przeciwnym zwrocie do pędu wyrzucanych spalin. Im większa prędkość wyrzucanego gazu, tym też większy jest jego pęd. Do osiągnięcia odpowiedniej prędkości rakiety, ważne jest by gazy spalinowe wyrzucane były z rakiety odpowiednio szybko, a to (w chemicznym silniku rakietowym) osiągane jest przez kontrolowany proces spalania mieszanki paliwowej w komorze spalania. Najpopularniej wykorzystywanym paliwem w przypadku rakiet na paliwo ciekłe są obecnie nafta, ciekły wodór oraz ciekły metan (fazy ciekłe mają dużo większą gęstość energii). Jako utleniacza (który jest niezbędny w celu osiągnięcia odpowiedniego tempa spalania) wykorzystywany jest natomiast skroplony tlen. Zachodząca w komorze spalania reakcja generuje ogromną temperaturę i ciśnienie. Przewężenie (ang. throat), pomiędzy komorą spalania a dyszą wylotową (ang. nozzle) to natomiast (zgodnie z równaniem Bernoulliego) miejsce w którym spada ciśnienie gazów, jego prędkość zaś szybko wzrasta (w kierunku dyszy), osiągając wartości supersoniczne. Wynika to z różnicy ciśnień pomiędzy komorą spalania a dyszą. Opisaną tu sytuację obrazuje poniższy schemat:

Rakieta

Przejdźmy teraz do podstawowych rozważań ilościowych. Będziemy musieli w tym celu posłużyć się elementami rachunku różniczkowego i całkowego. Czytelnika niezaznajomionego z tym działem matematyki zachęcam do szybkiego przyswojenia niezbędnej wiedzy w oparciu o Kurs Analizy Matematycznej na Khan Academy.

Oznaczmy przez M masę rakiety a przez m masę wyrzucanych produktów spalania. Tak, że rozważając infinitezymalne zmiany mas możemy zapisać dM = - dm. Przez v oznaczmy natomiast prędkość rakiety (dla uproszczenia rozważamy ruch w jednym kierunku). Dla uproszczenia przyjmijmy ponadto, że czynnik roboczy wyrzucany jest z silnika rakiety ze stałą, względem rakiety, prędkością u. Przy tym założeniu, postarajmy się teraz wyznaczyć zmianę prędkości rakiety w rezultacie wyrzucenia produktów spalania o masie dm.

W tym celu, rozważmy sytuację w której w chwili t_1 znajdujemy się w układzie spoczynkowym rakiety, w którym jej prędkość (v) jaki i pęd (p = Mv) są równe zeru. W infinitezymalnym przedziale czasu dt (czyli do chwili t_2=t_1+dt) nastąpił wyrzut masy dm, co spowodowało obniżenie masy rakiety do wartości M-dm oraz wzrost jest prędkości od zera do dv. Wyrzucane produkty spalania zyskują natomiast pęd u dm. W konsekwencji, zmianę pędu dp całego układu (rakieta oraz wyrzucane produkty spalania) możemy zapisać jako przyrost pędu rakiety pomniejszony o pęd wyrzucanych gazów:

dp=(M-dm)dv-udm.

Pomijając wyraz wyższego rzędu dm dv  (dm jest infinitezymalnie małe, można je więc zaniedbać względem skończonego M), otrzymujemy poszukiwane wyrażenie:

dp=Mdv-udm.   (1)

Druga zasada dynamiki Newtona mówi nam, że zmiana pędu w czasie równa jest sile:

\frac{dp}{dt}=F.   (2)

W przypadku braku działania na układ sił zewnętrznych (F=0) nie następuje zmiana jego pędu (dp=0). W sytuacji takiej spełniona jest zasada zachowania pędu którą, w rozważanym przypadku, możemy wyrazić poprzez równanie:

Mdv=udm,  (3)

będące bezpośrednią konsekwencję równania (1). Przypadek z niezerową siłą (na przykład działającą na rakietę i gazy wylotowe siłą grawitacji lub/i siłą oporu aerodynamicznego) pozostawiamy Czytelnikowi do samodzielnej analizy. My zaś przejdźmy do prześledzenia konsekwencji równania (3):

Równanie Ciołkowskiego. Wykorzystując wyprowadzoną z zasady zachowania pędu zależność (3), czyli M  dv = u dm, oraz relację dm = -dM otrzymujemy:

dv = - u \frac{dM}{M}.

Całkując to wyrażenie w przedziale od masy początkowej M_1 do masy końcowej rakiety M_2 uzyskujemy wyrażenie na całkowitą zmianę prędkości rakiety:

\Delta v = v_2-v_1 = \int_{v_1}^{v_2}dv= - u \int_{M_1}^{M_2} \frac{dM}{M} =  u  \ln \left(\frac{M_1}{M_2}\right).   (4)

Jest to sławny wzór Ciołkowskiego, opisujący zmianę prędkości rakiety \Delta v spowodowaną wyrzutem masy ze stałą prędkością u, od wartości M_1 do M_2. Jako przykład zastosowania, wykorzystajmy równanie (4) do oszacowania ilości paliwa jakie należy spalić w rakiecie żeby osiągnąć pierwszą prędkość kosmiczną, czyli prędkość jaką musi zyskać rakieta aby mogła orbitować na niskiej orbicie okołoziemskiej. Prędkość ta wynosi v_I = \sqrt{\frac{G M_z}{R_z}} \approx  7,9 \frac{km}{s} \approx 7900 \frac{m}{s}, gdzie G to stała grawitacji, M_z to masa Ziemi a R_z to promień Ziemi. Typowe prędkości wyrzutu produktów spalania w rakietach na paliwo ciekłe to u \sim 4000 \frac{m}{s}. Na podstawie równania (4), zmiana prędkości rakiety od v=0 do v=v_I wiąże się (w rozważanym przypadku rakiety jednoczłonowej) z następującą zmianą masy rakiety:

\frac{M_1}{M_2} = e^{v_I/u} \approx 7.2.

Oznacza to, że aby rakieta mogła wejść na niską orbitę okołoziemską, paliwo oraz utleniacz muszą stanowić przynajmniej

\frac{M_1-M_2}{M_1} \times 100 \% \approx 86 \%

jej początkowej masy!

Przejdźmy teraz do zdefiniowania dwóch podstawowych parametrów silnika rakietowego, mianowicie siły ciągu praz impulsu właściwego.  W tym celu, podstawmy do równania Newtona (2) wyrażenie na zmianę pędu (1). Otrzymamy wtedy:

M\frac{dv}{dt}-u\frac{dm}{dt}=F,

lub równoważnie

M\frac{dv}{dt}=F+u\frac{dm}{dt},   (5)

czyli tak zwane równanie Mieszczerskiego. Lewa strona równania (5) to szkolne wyrażenie: masa  M pomnożona przez przyśpieszenie (ponieważ a=\frac{dv}{dt}), pojawiające się w równaniu Newtona dla punktu materialnego o stałej masie. W rozważanym przypadku, z uwagi na zmianę masy rakiety w czasie, otrzymujemy efektywnie dodatkowy przyczynek do siły działającej na rakietę równy u\frac{dm}{dt}. Jest to tak zwana  siła ciągu rakiety:

F_c = u \frac{dm}{dt}.   (6)

W rzeczywistych, chemicznych silnikach rakietowych istnieje jeszcze jeden  przyczynek do siły ciągu. Wynika on z ciśnienia wywieranego przez wyrzucany z silnika gaz na wewnętrzną stronę dyszy wylotowej (patrz rysunek powyżej). Oznaczmy powierzchnię maksymalnego przekroju poprzecznego dyszy silnika przez A. Od strony wewnętrznej, na dyszę działa siła  F_1=Ap_w, gdzie p_w jest ciśnieniem wywieranym na dyszę przez gazy wylotowe. Po drugiej stronie dyszy panuje ciśnienie zewnętrzne p_0, które wywiera na dyszę siłę  F_2=Ap_0. Z uwagi na różnicę ciśnień  p_wp_0, na dyszę (i w konsekwencji na rakietę) działa wypadkowa siła

F_p =F_1-F_2=A(p_w-p_0).   (7)

Uwzględniając ten wkład w równaniu (5), możemy zapisać całkowitą siłę ciągu jako sumę wyrażeń (6) oraz (7):

F_c = u \frac{dm}{dt} + A(p_w-p_0).  (8)

W oparciu o siłę ciągu możemy natomiast zdefiniować wielkość zwaną impulsem właściwym, opisującą zmianę pędu rakiety względem utraconej masy:

I_{sp} := \frac{F_c dt}{g  dm}= \frac{F_c}{g  \dot{m}},  (9)

gdzie g\approx 9,81 \frac{m}{s^2} jest przyśpieszeniem grawitacyjnym na powierzchni Ziemi. Natomiast, \dot{m} := \frac{dm}{dt} to strumień masy gazów wylotowych. Impuls właściwy wyrażany jest w sekundach. W celu lepszego zrozumienia definicji (9), warto rozważyć przypadek siły ciągu dany przez równanie (6), zaniedbujące przyczynek od ciśnienia wywieranego na dyszę przez gazy wylotowe. Podstawiając wyrażenie (6) do równania (9), otrzymujemy:

I_{sp} =  \frac{F_c}{g  \dot{m}} =\frac{u \dot{m}}{g  \dot{m}} = \frac{u}{g}.  (10)

W tym wyidealizowanym przypadku, impuls właściwy jest więc innym sposobem wyrażenia prędkości wyrzucanego z silnika rakietowego czynnika roboczego (spalin).

spacex_its_raptor_engine_by_william_black-dajqa73
Podstawowe parametry silnika rakietowego Raptor firmy SpaceX. Źródło

Jako przykład zastosowania wprowadzonych powyżej wielkości, rozważmy przygotowywany przez firmę SpaceX silnik Raptor. Silnik ten znajdzie zastosowanie w rakiecie Big Falcon Rocket (BFR),  która zostanie wykorzystana do lotów na Księżyc oraz na Marsa.  Silnik Raptor wykorzystuje jako paliwo ciekły metan, który wraz z ciekłym tlenem (pełniącym rolę utleniacza) tworzy tak zwany Methalox, o który pisałem w artykule Kosmiczna stacja paliw.

W przypadku silnika Raptor, planowany impuls właściwy na powierzchni Ziemi ma wynosić I_{sp} \approx 334 s, zaś siła ciągu tego silnika ma sięgać F_c \approx 3000 kN = 3 MN. Na tej podstawie, możemy oszacować masę wyrzucanego, w każdej sekundzie, czynnika roboczego (tzw. strumień masy). Posługując się równaniem (9), otrzymujemy:

\dot{m} = \frac{F_c}{I_{sp} g} \approx  900 \frac{kg}{s}.

A więc, w każdej sekundzie pracy, z jednego  silnika wyrzucana jest prawie tona spalin, generujących ciąg rakiety. Pierwszy człon rakiety BFR ma mieć aż 31 takie silniki (we wcześniejszych planach liczba ta wynosiła 42). Mieszczące się, w pierwszym członie rakiety BFR około 3000 ton mieszanki paliwowej, pozwolą więc na pracę silników przez około dwie minuty pracy,  przy pełnym ciągu.  Ponadto, wykorzystując równanie (10) możemy oszacować prędkość gazów wylotowych

u \approx I_{sp}g \approx 3300 \frac{m}{s},

czyli około 10 M. Warto podkreślić, że prędkość ta stanowi jedynie około 10^{-5} prędkości światła (c \approx 300\ 000\ 000 \frac{m}{s}). Dużo większe prędkości wyrzucanej materii, a tym samym większe impulsy właściwe osiągane są w przypadku silników jonowych lub plazmowych. W ich przypadku, impuls właściwy może osiągać wartość kilku tysięcy sekund. Idąc dalej, coraz śmielej brane są obecnie pod uwagę silniki w których czynnikiem roboczym jest promieniowanie powstałe w wyniku anihilacji materii z antymaterią. Czyli tak zwane silniki na antymaterię, w których źródłem zmiany pędu rakiety są fotony poruszające się z prędkością światła (i posiadające pęd p = \hslash \omega). Taki czynnik roboczy wymaga jednakże uwzględnienia efektów relatywistycznych, przewidywanych przez szczególną teorią względności Einsteina. W konsekwencji, w przypadku takim, wyprowadzone powyżej równanie Ciołkowskiego, należy zmodyfikować do tak zwanego równania rakiety relatywistycznej.  To jednak nie koniec podróży w jaką może nas zabrać studiowanie fizyki silników rakietowych. Rozważania egzotycznych napędów rakietowych, takich jak chociażby napęd Alcubierre’a, są fantastyczną okazją do zagłębienia się we współczesną fizykę teoretyczną, czyli fizykę świata przyszłości.

© Jakub Mielczarek