Naukowe wyzwania a bezpieczeństwo Polski

Nie mając jasno wyznaczonego celu skazani jesteśmy na, jak mówią fizycy – błądzenie przypadkowe, przegrywając z tymi którzy takie cele przed sobą postawili i konsekwentnie do nich dążą. Dotyczy to zarówno naszych osobistych dróg życiowych, jaki i tych obranych kolektywnie przez zbiory jednostek, jakimi są społeczeństwa.

Czy społeczeństwo polskie wyznacza sobie takie globalne cele? Więcej, czy stawia przed sobą wyzwania, które są nie tylko spacerem po parku lecz wymagają od nas mobilizacji i determinacji? Trudno mi wskazać jednoznacznie na istnienie obecnie w Polsce takich wyzwań. Mamy pewne, rozmyte, wspólne cele jak chociażby to, że chcielibyśmy żeby Polska stała się krajem bogatszym. Taki cel nie jest jednak dobrze zdefiniowany. Wymaga on skwantyfikowania, na podobnej zasadzie jak przedsiębiorstwa określają roczne (lub bardziej odległe) plany przychodów i zysków, które później uparcie starają się realizować. W przypadku Polski, za ekonomiczne wyzwanie można by uznać wprowadzenie Polski do grupy G20 w przeciągu, powiedzmy, pięciu lat. To jest całkiem dobrze określony cel, którego osiągnięcie wymaga mobilizacji i odpowiedniego zaangażowania w obszarze gospodarki (ale również dyplomacji) w przeciągu najbliższych lat. Można, w dużym stopniu, określić jakie warunki musielibyśmy spełnić żeby dołączyć do tego elitarnego grona.

Jako, że jestem naukowcem, poza wyzwaniami ekonomicznymi, zastanawia mnie jednak również to czy przed Polską Nauką możemy postawić pewne globalne wyzwania, wyznaczające kurs jej rozwoju, co pozwoliłoby systematycznie odrabiać straty do światowej czołówki. Nie stawiając przed rodzimą Nauką takich wyzwań, będziemy niestety skazani na “błąkanie się”, zostając coraz bardziej w tyle. Ale czy takie dobrze określone wyzwania da się w ogóle zdefiniować i czym by one mogły być? Nasuwać się może na myśl: podniesienie polskich uczelni w rankingu szanghajskim, wzrost liczby publikacji w Nature oraz międzynarodowych patentów. Wejście Uniwersytetu Warszawskiego i Uniwersytetu Jagiellońskiego do trzeciej setki rankingu szanghajskiego może wydawać się dobrze określonym wyzwaniem.  Nie o to tu jednak chodzi. Nie robimy nauki dla pozycji w rankingach. To są kwestie wtórne.  Nauka powinna pracować dla dobra społeczeństwa.  A jeśli będzie to robione właściwie to i poziom jaki prezentuje będzie rósł. Dlatego też, chciałbym zastanowić się tutaj nad tym jaka Nauka jest Polsce najbardziej potrzebna i jakie w ramach niej wyzwania powinniśmy podejmować wspólnymi siłami, na skali dużo szerszej niż kilkuosobowe zespoły naukowe, na których opiera się obecnie, w głównej mierze, praca badawcza w Polsce.         

W moim przekonaniu, w pierwszej kolejności, Nauka powinna podejmować kierunki bezpośrednio związane ze strategicznymi dla Polski obszarami. W artykule tym, chciałbym zaś podkreślić znaczenie, w mojej opinii, najważniejszego z nich, jakim jest bezpieczeństwo, zarówno to militarne jak i energetyczne.  Nie trzeba nikomu uzmysławiać sytuacji geopolitycznej Polski i związanych z tym zagrożeń. Istnieje niezliczona liczba opracowań na ten temat, pominę więc wchodzenie w szczegóły.  Bezpieczeństwo jest kwestią nadrzędną i bez osiągnięcia odpowiedniego jego poziomu, trudno myśleć o stabilnym długofalowym rozwoju Polski.  Niestety, obecnie rozwój nowoczesnego zaplecza militarnego w Polsce opiera się głównie na kontraktach z zagranicznymi dostawcami technologii. Jestem realistą, pewnych rzeczy nie da się przeskoczyć w kilka lat. Problem opóźnienia technologicznego Polski jest głęboki i trudny do nadrobienia w krótkim okresie czasu. Jednakże, moje obserwacje nie wskazują na to by następowała w tym obszarze znacząca poprawa (mam tu na myśli nowoczesne technologie wojskowe).

W krajach wysoko rozwiniętych, takich jak Stany Zjednoczone, rozwój technologii z zakresu bezpieczeństwa jest silnie związany z prowadzeniem innowacyjnych badań naukowych. Jest to z korzyścią zarówno dla podniesienia poziomu bezpieczeństwa jak i dla samej Nauki, nie wspominając o ogromnym znaczeniu transferu opracowanych rozwiązań do przemysłu cywilnego. W Polsce, obszar ten wydaje się być zaś zupełnie niezagospodarowany. A przecież może on stanowić doskonały motor dla rozwoju Polskiej Nauki, dostarczając nam równocześnie tak ważnego poczucia bezpieczeństwa.

Zanim przejdę do podania propozycji konkretnych działań w tym kierunku, pozwolę sobie w tym miejscu zwrócić uwagę na jeszcze jedną ważną kwestię. Temat jest mi dobrze znany, a mianowicie chodzi o to co kieruje młodymi naukowcami w decyzji o prowadzeniu swoich badań poza granicami Polski. Czynnikiem decydującym, w dzisiejszych czasach,  nie są zazwyczaj kwestie finansowe. Prowadząc solidne badania, godziwe zarobki można  osiągnąć również w Polsce. Chodzi natomiast o to, że wciąż prowadzone w Polsce badania są często po prostu mało interesujące. Włączenie się w nie, nie stanowi dla młodych naukowców wyzwania. Chcą robić coś ciekawszego i ważniejszego. Możliwość taką odnajdują w grupach badawczych prowadzących nowatorskie prace naukowe, poza granicami naszego kraju.

Wydaje mi się, że podjęcie w Polsce strategicznych kierunków badawczych, mających jak to już podkreśliłem znaczenie dla bezpieczeństwa naszego kraju, stanowiłby bardzo atrakcyjną ofertę dla młodych naukowców. Nie chodzi oczywiście o to żeby młodzi naukowcy nie wyjeżdżali. Wyjeżdżać trzeba, rzecz w tym żeby mieli również do czego wracać. Ambitne, zakrojone na dużą skalę programy naukowe o bezpośrednim znaczeniu dla Polski działałyby jak magnes na najzdolniejsze umysły.  Kiedy można uczestniczyć w takim przedsięwzięciu, kwestia wynagrodzenia staje się poboczna. Ważne, że można być „u siebie”, blisko rodziny i przyjaciół, realizując swoje pasje i jednocześnie robiąc coś ważnego dla całego społeczeństwa. To są, uważam, kwestie niezwykle istotne. W Polsce, możliwość realizowania się w taki sposób jest jednak ograniczona.

W Stanach Zjednoczonych, innowacyjne projekty naukowe o znaczeniu dla obronności finansowane są przez osławioną Defense Advanced Research Project Agency (DARPA). Trochę w cieniu, działa jeszcze kilka podobnych agencji, jak w szczególności Intelligence Advanced Research Project Agency (IARPA), finansująca badania o znaczeniu dla pracy wywiadu. Próżno szukać w Polsce odpowiedników takich instytucji. W ramach firm wchodzących w skład Polskiej Grupy Zbrojeniowej oraz na Wojskowej Akademii Technicznej prowadzone są oczywiście prace badawczo-rozwojowe na potrzeby Sił Zbrojnych RP. Chodzi jednak o to by wyjść z badaniami mającymi znaczenie dla bezpieczeństwa poza te ramy i zaangażować potencjał naukowy uniwersytetów i cywilnych uczelni technicznych, realizując szeroko zakrojone (często interdyscyplinarne) projekty naukowe o znaczeniu strategicznym.

Żeby wyraźniej nakreślić to o jakiego typu projektach mowa, przytoczę tu kilka przykładów projektów finansowanych przez DARPA i IARPA. Na przykład, w latach 2001-2005 DARPA przeznaczyła 100 mln USD na projekt Quantum Information Science and Technology Program (QuIST), dedykowany przede wszystkim budowie systemów kryptografii kwantowej. Rozwiązania tego typu wykorzystują fizykę mikroświata – mechanikę kwantową – do tego by  wymieniać w sposób bezpieczny informacje pomiędzy np. jednostkami wojskowym lub ośrodkami decyzyjnymi.  Z kolei, jednym z projektów finansowanych obecnie przez IARPA jest Machine Intelligence from Cortical Networks (MICrONS), którego celem jest uzyskanie konektomu jednego milimetra sześciennego kory mózgowej (gryzonia), co będzie miało znaczenie dla uczenia sztucznych sieci neuronowych. Takie sieci znajdą później zastosowanie w systemach wykrywania różnego typu zagrożeń. Finansowanie  projektu to również 100 mln USD. Warto podkreślić, że jest to bardzo interdyscyplinarny projekt, w który zaangażowani są neurobiolodzy, chemicy jak i fizycy, informatycy i inżynierowie. Jest to więc doskonała okazja do rozwijania współpracy pomiędzy różnymi ośrodkami naukowymi. Kolejny aktualny przykład to program Blackjack, konstelacji dwudziestu nanosatelitów o zastosowaniu militarnym. DARPA zarezerwowała w 2018-tym roku na ten cel ponad 100 mln USD. Bez wątpienia, w projektach tego typu chcieliby bez wahania wziąć udział młodzi ale i starsi Polscy naukowcy i inżynierowie.

Wracając do Polski, budżet MON na rok 2019 wynosi  44,7 mld PLN (2,0% PKB). A co gdyby przeznaczyć z takiej kwoty jeden miliard złotych rocznie na innowacyjne programy badawcze związane z obronnością? Niewątpliwie, mogłoby to przynieść ogromne korzyści, zarówno dla bezpieczeństwa jak i dla samej Polskiej Nauki oraz polskiej gospodarki.  W kwocie 1 mld PLN (porównywalnej z jednym sporym kontraktem zagranicznym) udałoby się zrealizować powiedzmy 10 dużych projektów o budżecie 100 mln PLN każdy. Z budżetem 100 mln złotych można np. zbudować i umieścić na niskiej orbicie okołoziemskiej mikrosatelitę (ok. 10-20 kg) o przeznaczeniu wojskowym (obserwacje, łączność lub naprowadzanie pocisków). Za kolejne 100 mln PLN można zrealizować program budowy rakiety suborbitalnej (w przyszłości, elementu systemu Wisła).  100 mln PLN to również wystarczające środki do tego by połączyć najważniejsze ośrodki decyzyjne w Polsce systemami do kwantowej dystrybucji klucza (zbudowanymi w Polsce). W kwocie 100 mln PLN można również zaprojektować i zbudować nowoczesny system radarowy (typu AESA), mogący w przyszłości stanowić część tarczy antyrakietowej.  Wymieniam tu przykłady, dla których wiem, że istnieje zaplecze intelektualne i techniczne do ich realizacji w Polsce.  Do tego, w skali roku, pozostaje 5 kolejnych projektów. Każdy rozpisany na 4-5 lat realizacji.

Można sobie wyobrazić o ile bezpieczniejsi i rozwinięci technologicznie stalibyśmy się dzięki takim działaniom w perspektywie dekady, mając zrealizowanych kilkadziesiąt ambitnych projektów naukowo-technicznych z zakresu bezpieczeństwa. Polska Nauka rozkwitłaby a pozycje polskich uczelni wspięły się w rankingach niejako “przy okazji”. Jest to wizja wymagająca oczywiście zarówno dalszej pogłębionej analizy jak i późniejszych odważnych decyzji politycznych. Jest ona jednak realna i możliwa do wcielenia.  

© Jakub Mielczarek

Dwanaście technologii jutra

Żyjemy w niesamowitych czasach intensywnego rozwoju wspaniałych technologii. Wiele z nich wywodzi się z zaawansowanych i kosztownych badań podstawowych, inne są wynikiem inżynieryjnej wirtuozerii, bazującej na ugruntowanej już wiedzy naukowej. Jedno jest pewne,  technologie te transformują świat w którym żyjemy  i przez to, w pewnym sensie, również nas samych. Żeby ocenić jakie będą skutki tych przemian należy zrozumieć możliwości i ograniczenia wyłaniających się nowych rozwiązań. Ich lista jest długa, a szczegółowa analiza żmudna i wielowymiarowa. Nie jest jednak moim celem by ją tutaj przeprowadzać. Mógłbym Cię po prostu zanudzić. W zamian, chciałbym zwięźle przedstawić 12 wybranych przeze mnie (jednakże stosunkowo reprezentatywnych) kierunków. Celem jaki sobie stawiam jest to byś mogła lub mógł spojrzeć na nie niejako z lotu ptaka, umożliwiając Ci uchwycenie szerszej perspektywy. Mam nadzieję, że mój wysiłek pomoże Ci, choć w pewnym wymiarze, ujrzeć ostrzej świat w niedalekiej przyszłości i dostrzec w nim dla siebie nowe możliwości, które pozwolą Tobie lub też np. Twojej firmie rozwinąć się. Zrozumienie technologii, pozwoli Ci również lepiej przygotować się na nadchodzące zmiany, przez co łatwiej się do nich dostosujesz i szerzej wykorzystasz pojawiające się nowe szanse. Wybrane przeze mnie kierunki są obecnie intensywnie rozwijane i z dużym prawdopodobieństwem będą miały istotne znaczenie w nieodległej przyszłości, przez którą rozumiem najbliższą dekadę (2020-2030). Na konstrukcję tej listy niewątpliwe miały wpływ moje osobiste zainteresowania i obszar posiadanych kompetencji. Z tego powodu, nie jest ona obiektywna, choć starałem się by cechowała się zróżnicowaniem i zawierała rozwiązania nie tylko z obszarów najbliższych mojej ekspertyzie. Ważnym aspektem, który staram się podkreślić, to znaczenie dyskutowanych kierunków w kontekście wyzwań stojących przed światem.

1. Komputery kwantowe

Pozwolę sobie zacząć od najbliższego mi, jako fizykowi teoretykowi, tematu czyli od technologii kwantowych, a mówiąc precyzyjniej skoncentruję się tutaj na kwestii komputerów kwantowych. Do innych przykładów technologii kwantowych powrócę w punktach 26 i 7.  Komputery kwantowe opierają swoje działanie o zasady mechaniki

ibm-q
Komputer kwantowy firmy IBM. Źródło

kwantowej (fizyki mikroświata). Choć teoretyczne podwaliny ich funkcjonowania powstały jeszcze w latach osiemdziesiątych ubiegłego wieku, dopiero ostatnie lata przyniosły intensywne przyśpieszenie w rozwoju kwantowych technologii obliczeniowych. Rozwój ten przebiegał i nadal przebiega w pierwszej fazie charakteryzującej nowe technologie, związanej z szybkim wzrostem zainteresowania. Efekt ten, na zasadzie sprzężenia zwrotnego napędza rozwój technologi, generując rosnący entuzjazm, w szczególności  inwestorów. Pęcznieją również oczekiwania, które niestety często rozbieżne są z faktycznymi możliwościami technologii. Również kwantowy tzw. hype czeka niebawem przejście do fazy ostudzenia emocji. Technologie kwantowe jednak wybronią się, ponieważ dadzą w wielu obszarach przewagę nad komputerami klasycznymi. Wynika to w szczególności z tak zwanego paralelizmu kwantowego, umożliwiającego zrównoleglenie danego problemu i przez to redukcję jego złożoności obliczeniowej. Sztandarowymi przykładami są: algorytm faktoryzacji Shore’a, algorytm przeszukiwania (nieuporządkowanych zbiorów) Grovera lub algorytm kwantowego wyżarzania (ang. quantum annealing). Ograniczenia kwantowych komputerów wiążą się jednak z dużą podatnością stanów kwantowych kubitów na środowisko zewnętrzne. W celu zredukowania  tego efektu (tzw. kwantowej dekoherencji) procesory kwantowe muszą być przeprowadzane w temperaturze bliskiej zera bezwzględnego. Ponadto, w celu redukcji błędów konieczne jest stosowanie tak zwanej kwantowej korekcji błędów, która wykorzystuje znaczną część kubitów procesora. Ogranicza to istotnie liczbę kubitów, które faktycznie możemy przeznaczyć do wykonania interesującego nas algorytmu. W konsekwencji, użytecznych (tzw. fault tolerant) komputerów kwantowych, które będą dawały możliwość wykonania operacji niemożliwych do przeprowadzenia na superkomputerach klasycznych możemy się spodziewać za nie wcześniej niż 5 lat. Komputery posiadające łącznie 100 kubitów powstaną wcześniej, jednakże poziom ich błędów będzie wciąć zbyt wysoki, a struktura sprzężeń pomiędzy kubitami zbyt rzadka by mogły one konkurować z klasycznymi maszynami. W drugiej połowie nadchodzącej dekady możemy jednak oczekiwać rozwoju szerokiego spektrum zastosowań komputerów kwantowych. W szczególności,  w kontekście rozwiązywania problemów o dużej złożoności (optymalizacja, łamanie szyfrów, uczenie sztucznych sieci neuronowych, itp.) oraz symulacji układów kwantowych (np. w ramach chemii kwantowej, fizyki materii skondensowanej lub kwantowej grawitacji). Przeprowadzanie na procesorach kwantowych symulacji np. skomplikowanych molekuł znajdzie zastosowanie m.in. przy opracowywaniu leków.  Jako wprowadzenie do zagadnienia programowania komputerów kwantowych zachęcam do lektury moich wcześniejszych wpisów: Elementary quantum computing oraz Kwantowe cienie.

2. Nowe technologie kosmiczne

Globalna branża kosmiczna znajduje się obecnie w fazie transformacji z obszaru dominacji państwowych agencji kosmicznych do rosnącego znaczenia przedsiębiorstw, które zaczynają realizować swoje własne programy kosmiczne. Zjawisko to jest częścią tak zwanego podejścia New Space.  Najbardziej znanymi przykładami są tu Space X, Blue Origin oraz Virgin Galactic. Wszystkie te trzy firmy rozwijają technologie wynoszenia ładunków i

xinglong
Kwantowa dystrybucja klucza pomiędzy satelitą Micius a stacją naziemną. Źródło

osób w ramach lotów suborbitalnych lub orbitalnych. Loty suborbitalne mają duże znaczenie dla otwarcia kosmosu dla turystyki. Dotychczasowe sukcesy trzech wspomnianych firm, dają spore szanse na intensywny rozwój suborbitalnej turystyki kosmicznej w nadchodzącej dekadzie. Z drugiej strony, rozwój prywatnych inicjatyw związanych z lotami orbitalnymi, korzystnie wypłyną na ceny umieszczania ładunków na niskiej orbicie okołoziemskiej. Do tego dochodzi miniaturyzacja systemów satelitarnych, w szczególności w ramach standardu CubeSat – kostek o wymiarach 10x10x10 cm (1U), z których można budować w pełni funkcjonalne nanosatelity. Zbudowanie i umieszczenie na niskiej orbicie okołoziemskiej prostego nanosatelity o rozmiarze 1U można dzisiaj przeprowadzić w ramach budżetu zamykającego się w kwocie 1 mln złotych.   Otwiera to szerokie perspektywy do przeprowadzenia badań w warunkach mikrograwitacyjnych, jak również nowe pole do prowadzenia działalności biznesowej. Najpopularniejsze  dzisiaj obszary tej aktywności dotyczą systemów obserwacji ziemi, łączności oraz nawigacji.  Najbardziej, w mojej opinii, nowatorskim kierunkiem technologicznym, który będzie się w tym kontekście rozwijał jest tak zwana kwantowa łączność satelitarna. Bazuje ona na przesyłaniu pojedynczych fotonów, w których stanach kwantowych zakodowany jest klucz umożliwiający bezpieczne przesyłanie informacji (już za pośrednictwem kanałów klasycznych). Ta tak zwana kwantowa dystrybucja klucza stanowi zasadniczy element internetu kwantowego, który dyskutuję w punkcie 7. Warto tu podkreślić, że kwantowa dystrybucja klucza została pomyślnie przeprowadzona w 2017-tym roku na odległościach międzykontynentalnych, wykorzystując specjalnie do tego zbudowanego satelitę Micius. Obecnie przygotowywanych jest szereg projektów rozwijających tę technologię, opierających się na nanosatelitach w standardzie CubeSat [Ref].

3. Biologia syntetyczna

Komórki już nie tylko muszą robić to do czego zostały wykształcone w toku ewolucji. Dzisiejsza nauka zaczyna umożliwiać nam ich programowanie, tak by realizowały zaplanowane przez nas zadania. Podobnie jak w przypadku programowania komputerów, możemy, wykorzystując komórkowy język programowania (np. SBOL), stworzyć program, wynikiem kompilacji którego jest konkretna sekwencja DNA. Dzięki

eight_col_synth_meat
Syntetyczne mięso. Źródło

rozwiniętym technikom syntezy DNA, możemy dzisiaj bez trudu stworzyć zaprojektowany przez nas materiał genetyczny, po czym dokonać jego mikroiniekcji do wnętrza komórki, wymieniając tym samy jej oryginalny “software”. Metodę tę obecnie rozwija się w przypadku jednokomórkowych organizmów jakimi są bakterie. Pozwala to programować je tak by realizowały określone funkcje np. w bioreaktorach. Kolejnym ważnym przykładem z obszaru biologi syntetycznej jest mięso in vitro. Warto tu zaznaczyć, że około 15 % gazów cieplarnianych (metan) pochodzi od zwierząt. Produkcja mięsa jest obecnie nieefektywna, a wzrost zamożności społeczeństw napędza popyt na produkty mięsne, przyśpieszając negatywne zmiany klimatyczne. Istotny jest również aspekt humanitarny, związany z masowym chowem i ubojem zwierząt. Wprowadzenie syntetycznego mięsa stanowi obiecujące rozwiązanie tych problemów. Warto zauważyć, że w bioreaktorach do produkcji syntetycznego mięsa zastosowanie mogą znaleźć opisane wcześniej programowalne bakterie. Dalsze informacje na temat biologi syntetycznej i tego jak samemu zacząć przygodę z tą dyscypliną można znaleźć np. w książce BioBuilder, której pierwszy rozdział można bezpłatnie przeczytać pod niniejszym linkiem.  

4. Sekwencjonowanie genomu

Materiał genetyczny potrafimy dzisiaj nie tylko syntezować, ale również sekwencjonować, choć jeszcze na początku tego milenium było to zadanie niezwykle ambitne. Zakończony w 2005-tym roku projekt zsekwencjonowania ludzkiego genomu – Human Genome Project pochłonął około trzech miliardów dolarów. Od tego czasu, koszt zsekwencjonowania ludzkiego genomu spada szybciej niż wykładniczo, co widać na

costpergenome2015_4
Koszty pełnego sekwencjonowania genomu ludzkiego. Źródło

załączonym wykresie.  Obecnie, cena zsekwencjonowania pełnego genomu wynosi poniżej kilkuset dolarów. Natomiast, za kwotę około 1000 USD można zakupić własny miniaturowy sekwencer oparty o technologię sekwencjonowania przez nanopory (rozwijane głownie przez firmę Oxford Nanopore Technologies). W przeciągu najbliższej dekady, możemy spodziewać się dalszej redukcji kosztów sekwencjonowania genomu, aż do wartości zapewniającej wręcz bezpłatną (w ramach opieki zdrowotnej) możliwość przeprowadzenia takiej analizy.  Wyzwaniem jest jednak to, jaką użyteczną informację możemy wydobyć z analizy naszego genomu. Niewątpliwie, genom zawiera całe bogactwo danych, jednoznacznie nas identyfikujących, w związku z czym podlegać będzie musiał specjalnym regułom bezpieczeństwa. Przesyłanie takiej informacji pomiędzy ośrodkami medycznymi będzie w przyszłości zabezpieczone przez wprowadzane obecnie algorytmy kryptografii postkwantowej lub też z wykorzystaniem rozwiązań kryptografii kwantowej (wykorzystujące kwantowy internet, dyskutowany w punkcie 7). Niewątpliwie, metody sztucznej inteligencji (dyskutowane w punkcie 6) istotnie przyczynią się do analizy materiału genetycznego i przygotowywania na jego podstawie rekomendacji oraz indywidualnych (spersonalizowanych) terapii. Możemy oczekiwać, że powszechne sekwencjonowanie genomu znacząco przyśpieszy rozwój medycyny personalizowanej, w ramach której np. różne wersje danego leku będą podawane w zależności od profilu genetycznego pacjenta.

5. Biodruk 3D 

Biodruk 3D jest wyłaniającą się nową technologią stawiającą sobie za jeden z głównych celów stworzenie narzędzia umożliwiającego wytwarzanie w sposób sztuczny w pełni funkcjonalnych narządów, mogących stanowić transplanty do przeszczepów. Jest to cel niezwykle ambitny, niemniej jednak postęp jaki dokonał się w przeciągu ostatnich kilku

produkt_dscf8374-white-bg-lighter-blue-x-square
Przykładowa komercyjnie dostępna biodrukarka 3D. Źródło

lat (w ramach którego biodruk 3D ukształtował się jako niezależna dyscyplina naukowa) daje silne podstawy do stwierdzenia, że nie ma fundamentalnych przeszkód dla których cel powyższy nie mógłby zostać ostatecznie osiągnięty. Warto przytoczyć tu, że na chwilę obecną z wykorzystaniem technologii biodruku 3D wytworzono między innymi modele: skóry, tkanki wątroby  czy też (bijącego) organoidu serca. Wytworzone w technologii biodruku 3D transplanty ucha, kości i mięśni przeszły pomyśle testy na myszach i szczurach. Powyższe obiecujące wyniki dały impuls do opracowania rozwiązań i usług w zakresie biodruku 3D oferowanych przez takie firmy jak Organovo (USA),  Aspect Biosystems (Kanada), 3D Bioprinting Solutions (Rosja)  czy Rokit (Korea Południowa). Ważnym wyzwaniem dla biodruku 3D jest wykorzystanie pluripotentnych komórek macierzystych, tak by uzyskać możliwość przygotowania transplantu 3D w oparciu o pobrany od pacjenta wycinek tkanki. Zanim jednak biodruk 3D znajdzie zastosowanie w praktyce klinicznej, będzie najpierw wykorzystywany do przygotowania trójwymiarowych hodowli przeznaczonych do testowania leków oraz np. tworzenia (dyskutowanego w punkcie 3) syntetycznego mięsa. Na zakończenie, pozwolę sobie dodać, że od kilku lat badania nad biodrukiem 3D prowadzimy w ramach Garażu Złożoności na Uniwersytecie Jagiellońskim [Ref]. 

6. Sztuczna inteligencja 

Sztuczna inteligencja o której tak dużo dzisiaj słyszymy to głównie tak zwana “wąska” sztuczna inteligencja (Artificial Narrow Intelligence – ANI) wyspecjalizowana na rozwiązywaniu konkretnego typu problemów. Na przykład, ANI potrafi rozpoznawać obrazy  lub też wygrywać z mistrzami gry w go. Zastosowań ANI jest obecnie na prawdę dużo. ANI opiera się głównie na tak zwanych głębokich sztucznych sieciach

intel-neuromorphic-chip-loihi-2
Neuromorficzny procesor Loihi firmy Intel. Źródło

neuronowych (ang. deep learning), których struktura inspirowana jest budową kory mózgowej. Warto tu dodać, że złożony proces uczenia sieci neuronowych może zostać wsparty przez komputery kwantowe (dyskutowane w punkcie ). Nadchodząca dekada przyniesie niewątpliwie nie tylko lawinę nowych zastosowań ANI ale również nastąpi znaczący postęp w kierunku stworzenia tak zwanej ogólnej sztucznej inteligencji (Artificial General Intelligence – AGI). AGI definiuje się jako typ sztucznej inteligencji odpowiadającej zdolnościom umysłowym człowieka.  Rozważa się obecnie kilka dróg do utworzenia AGI. Osobiście, za najbardziej obiecującą (i już najbardziej zaawansowaną)  drogę do osiągnięcia AGI uważam symulacje ludzkiego mózgu. Badania zmierzające w tym kierunku prowadzone są m.in. w ramach flagowego projektu Komisji Europejskiej Human Brain Project (HBP).  Symulacje te napotykają na szereg problemów natury technicznej. Jednym z obiecujących możliwości ich przezwyciężenia i  szybszego przybliżenia nas do AGI są  procesory neuromorficzne. Procesory takie już na poziomie swojej architektury odwzorowują strukturę połączeń neuronalnych, co znacznie ułatwia prowadzenie symulacji. Przykładem takiego procesora jest chip Loihi zbudowany przez firmę Intel.  Zawiera on 130 000 sztucznych neuronów oraz 130 milionów synaps. Architekturę neuromorficzną wykorzystuje się również w niedawno uruchomionym superkomputerze SpiNNaker, działającym w ramach projektu HBP. Do przeprowadzenia symulacji systemów neuronalnych nie wystarczy jednak sam software i hardware. Potrzebne są  również dane wejściowe do przeprowadzenia symulacji, lub mówiąc precyzyjniej emulacji mózgu. Należy je pozyskać z inwazyjnego lub bezinwazyjnego obrazowania mózgu. W szczególności, obiecująca jest inwazyjna metoda oparta o tzw. Serial Section Electron Microscopy. Z jej pomocą, uzyskano niedawno kompletny konektom mózgu małej rybki o nazwie Danio pręgowany [Ref]. Zobrazowanie tą metodą i zrekonstruowania konektomu jednego milimetra sześciennego tkanki mózgowej stawia sobie za cel, rozpoczęty w 2016-tym roku,  projekt MICrONS. Patrząc bardziej w przyszłość, osiągnięcie AGI, otworzy drogę do tak zwanej superinteligencji (Artificial Super Intelligence – ASI), przekraczającej ludzkie możliwości umysłowe.

7. Internet kwantowy 

Internet kwantowy to hipotetyczna globalna sieć kwantowa (ang. quantum network), która pozwoli w przyszłości na wymianę informacji kwantowej, w szczególności pomiędzy komputerami kwantowymi (o których pisałem w punkcie 1 ). Czym faktycznie okaże się kwantowy internet i jakie będzie jego znaczenie, tego jeszcze nie wiemy. Pierwszym zaś etapem jego tworzenia, rozwijanym obecnie, jest kwantowa dystrybucja klucza (KDK).  Kwantowa dystrybucja klucza jest,

qkd_product_small
Zestaw do kwantowej dystrybucji klucza. Źródło

rozważaną w ramach kryptografii kwantowej  metodą bezpiecznego przesyłania klucza za pośrednictwem stanów kwantowych pojedynczych fotonów. Metoda ta wykorzystuje własności mechaniki kwantowej (w szczególności tak zwane twierdzenie o zakazie klonowania) do przesyłania klucza, który zostanie później wykorzystany do zaszyfrowania i odszyfrowania przesyłanej już przez kanał klasyczny informacji.  Kwantowa dystrybucja klucza jest rozwiązaniem,  które zostało wdrożone do komercyjnego użytku.  Na zdjęciu powyżej można zobaczyć przykładowy zestaw do KDK. Dostępne jednakże obecnie rozwiązania posiadają jedno kluczowe ograniczenie. Mianowicie, jest to dystans, na który możemy przesłać zabezpieczoną kwantowo informację. Wiąże się to z tłumieniem fotonów w światłowodzie i koniecznością stosowania skomplikowanych tzw. powielaczy kwantowych. Obiecującym rozwiązaniem tego problemu jest przesyłanie fotonów z zakodowaną informacją kwantową poprzez atmosferę oraz przestrzeń kosmiczną. Udane próby interkontynentalnej KDK z wykorzystaniem kwantowych technologii satelitarnych udało się przeprowadzić w 2017-tym roku, co dyskutuję we wpisie Kwantowa łączność satelitarna. Obecnie trwają prace nad kilkoma projektami satelitarnymi które mają na celu rozwój kwantowych technologii związanych z łącznością satelitarną. Stworzenie podwalin dla internetu kwantowego to również jeden z filarów, rozpisanego na okres dziesięciu lat (2018-2028), flagowego programu Komisji Europejskiej Quantum Flagship.

8. Nowa energetyka jądrowa 

Technologiczny rozwój naszej cywilizacji wymaga coraz większej ilości energii. Popyt ten jest dzisiaj wciąż w dużej mierze zaspokajany przez paliwa kopane, spalanie których niesie jednak negatywne skutki dla jakości powietrza oraz prowadzi do zmian klimatycznych. Odnawialne źródła energii takie jak fotowoltaika i farmy wiatrowe dostarczają jedynie częściowego rozwiązania tego problemu. Przeszkodą w ich rozwoju jest problem magazynowania energii, który jednakże może być w dużym stopniu

41809720041_48b2f2d53f_b
Plac budowy reaktora termojądrowego ITER. Źródło

przezwyciężony stosując takie rozwiązania jak systemy power-to-gas czy też poprzez redukcję strat na przesyle energii na duże odległości (np. stosując w przyszłości nadprzewodzące sieci transmisyjne). Duże nadzieje związane z zapewnieniem stabilnego źródła energii (zarówno elektrycznej jak i cieplnej) niosą nowe rozwiązania w obszarze energetyki jądrowej. Wymarzonym źródłem energii jest kontrolowana reakcja syntezy (fuzji) termojądrowej.  Obecnie we francuskiej Prowansji trwa budowa eksperymentalnego reaktora ITER, mającego rozpocząć pierwsze eksperymenty z plazmą w połowie nadchodzącej dekady. Do 2035-tego roku planowane jest natomiast osiągnięcie generacji mocy rzędu 1GW (tyle samo co w typowym bloku elektrowni) i samo-podtrzymywanie plazmy przez nawet 1000 sekund. Jeśli projekt zostanie zwieńczony sukcesem, na jego kanwie ma zostać uruchomiony (prawdopodobnie w latach 2050-2060) pierwszy komercyjny blok termojądrowy o nazwie DEMO. Są to jednak odległe perspektywy. Dużo realniejsze w nadchodzącej dekadzie może natomiast stać się wykorzystanie nowych typów reaktorów bazujących nie na syntezie lecz na, stosowanym obecnie w elektrowniach atomowych, rozpadzie jądrowym.  Chodzi mianowicie o tak zwane reaktory jądrowe IV generacji, których bardzo obiecującym  przykładem (w perspektywie najbliższej dekady) jest reaktor wysokotemperaturowy chłodzony gazem (HTRG – High Temperature Gas-cooled Reactor).   Reaktory HTRG pozwalają na bezpieczną i bezemisyjną generację dużych ilości ciepła, znajdującego zastosowanie w przemyśle ciężkim, np. do wytopu żelaza. Ponadto, odbiorcą ciepła może być proces wytwarzania wodoru do zasilania ogniw paliwowych znajdujących zastosowanie w elektromobilności, dyskutowanej w punkcie 9. W przeciwieństwie do standardowych elektrowni jądrowych, reaktory HTRG o mocy rzędu 200 MW mają konstrukcję modułową i można je w znacznym stopniu budować w fabryce po czym integrować w miejscu przeznaczenia (np. na terenie huty).

9. Elektromobilność 

Samochody elektryczne przez wiele lat wydawały się mrzonką. Powstające prototypy były raczej ciekawostką i mało kto na poważnie brał pod uwagę możliwość tego, że za jego życia elektrycznie napędzane samochody zaczną królować na drogach i sama/sam zasiądzie za kierownicą jednego z nich. Wszystko jednak zmieniło się w przeciągu  kilku ostatnich lat,

www.helgilibrary
Prognoza rocznej sprzedaży aut elektrycznych. Źródło

głównie za sprawą pojazdów firmy Tesla.  W samym 2018-tym sprzedaż samochodów elektrycznych w USA zanotowała wzrost na poziomie 81 %, osiągając 2.1 % procent rynku samochodów w tym kraju. Globalny udział samochodów elektrycznych na koniec 2018-tego roku to zaś już 4.6%. Najwięcej z nich sprzedaje się w Chinach, gdzie liczba ta przekroczyła już roczną sprzedaż miliona sztuk. Jak wskazuje raport z 2016-tego roku, przygotowany przez Helgi Library, do końca 2030-tego roku około 20% sprzedawanych samochodów będą stanowiły samochody elektryczne. Będzie się to przekładało na sprzedaż około 20 milionów sztuk rocznie.  Otrzymane jednak w latach 2017-2018 wzrosty przewyższają prognozy na te lata. W konsekwencji, jak wskazują aktualniejsze analizy, poziom 20% w USA może zostać osiągnięty już w 2025-tym roku. Kluczowym czynnikiem który zadecyduje o adaptacji samochodów elektrycznych będzie ich cena. Od strony osiągów, samochody te już nie tylko dorównują tym konwencjonalnym, a wręcz w wielu aspektach są od nich lepsze (np. przyśpieszenie). Cena  w dużym stopniu uzależniona jest od kosztów baterii. Technologa która jest tu głównie stosowana to akumulatory litowo-jonowe (Li-Ion). Sztandarowy produkt Tesli Model S w wersji o pojemności 85kWh posiada matrycę 7104 akumulatorów o rozmiarach nieco większych od bateria AA każdy.  Rosnący popyt na akumulatory litowo-jonowe mają zaspokoić, między innymi, powstające giga fabryki (Gigafacory).  Ich pracę mogą jednak zakłócić ceny kluczowych do wytworzenie akumulatorów Li-Ion pierwiastków – litu i kobaltu. Notowania tych surowców odnotowały w ostatnich latach bardzo dynamiczny wzrost. Jednak baterie do samochodów to nie tylko problem kosztów ich wytworzenia, ale również ich recyklingu. Alternatywą dla akumulatorów mogą zaś okazać się ogniwa wodorowe. Z pewnością, rozwój elektromobilności dokona rewolucji rynku samochodowego oraz takich obszarów jak serwisowanie pojazdów. Warte podkreślenia jest to, że równolegle do rozwoju elektromobilności opracowywane i wdrażane są rozwiązania związane z autonomicznością pojazdów (oparte m.in. o wąską sztuczną inteligencję, dyskutowaną w punkcie 6 oraz nawigację satelitarną – punkt 2).   Połączenie tych dwóch elementów dokona w nadchodzącej dekadzie transformacji motoryzacji, a nazwa “samochód” nabierze nowego znaczenia.  Rosnąca rola bezemisyjnych samochodów elektrycznych będzie miała istotne znaczenie dla ograniczenia emisji gazów cieplarnianych i zanieczyszczeń do atmosfery.

10. Kolej próżniowa 

W sierpniu 2013-tego roku grupa inżynierów z firm Tesla i SpaceX, pod kierownictwem Elona Muska, przedstawiła koncepcję nowego środka transportu, określonego mianem hyperloop.  Założenia stojące za tym rozwiązaniem oraz  wstępne studium wykonalności  zawarto w raporcie Hyperloop Alpha.   Idea hyperloop polega na transporcie kapsuły (z pasażerami lub towarami) w rurze z obniżonym ciśnieniem, co ma na celu

image_04
Testowa linia kolei próżniowej firmy Hyperloop One. Źródło

zredukowanie oporu aerodynamicznego. Zakłada się, że kapsuła mogłaby poruszać się z prędkościami osiągającymi prędkości dźwięku, co stanowiłoby realną konkurencję dla komunikacji lotniczej na odległościach subkontynentalnych. Niezwykle ważne jest również to, że hyperloop wykorzystując jedynie energię elektryczną jest rozwiązaniem bezemisyjnym. Jego rozwój, jako alternatywy dla nieekologicznego ruchu lotniczego, jest więc ważny z punktu widzenia ograniczania emisji dwutlenku węgla do atmosfery.  Nad wdrożeniem technologii hyperloop pracuje obecnie kilka firm, wśród których wiodącą rolę odgrywają Hyperloop One i Hyperloop Transportation Technologies. W Polsce ideę hyperloop rozwija startup Hyperloop Poland. Wdrożenie hyperloop jako środka transportu stawia szereg wyzwań zarówno natury inżynieryjnej jak i ekonomicznej. Problemem technicznym jest, w szczególności, kwestia kompresji powietrza w przedniej części kapsuły i związany z tym wzrost ciśnienia, hamujący ruch samej kapsuły. Efekt ten zaczyna być szczególnie dokuczliwy gdy prędkość kapsuły osiąga prędkość dźwięku, uniemożliwiając cząsteczkom powietrza opływ kapsuły poprzez obszar pomiędzy wewnętrzną powierzchnią rury, a powierzchnią kapsuły.  Zjawisko to wiąże się z istnieniem tak zwanej granica Kantrowitza (ang. Kantrowitz limit), która zadaje maksymalną prędkość z jaką może poruszać się obiekt dla określonego stosunku przekroju tego obiektu względem przekroju poprzecznego rury.  Rozwiązaniem problemu wzrostu ciśnienia powietrza w przedniej części kapsuły jest zastosowania kompresora, który odpompowuje nadmiar powietrza do tylnej części kapsuły. Rozwiązanie takie ma jeszcze jedną zaletę; mianowicie, odprowadzane powietrze może zostać użyte do utrzymania kapsuły na wytworzonej poduszce powietrznej, jak w przypadku poduszkowca. Zastosowanie lewitacji (w tym przypadku ciśnieniowej) jest kluczowe do zredukowania tarcia pomiędzy kapsułą, a tubą. Alternatywnie, rozważane jest zastosowanie lewitacji magnetycznej, jak np. w szanghajskim Maglevie. Wykorzystanie takiego rozwiązania jest jednak dużo kosztowniejsze i wymaga większego zasilania (chyba, że zastosowane zostaną magnesy stałe).  Budowa od podstaw infrastruktury Hyperloop to ogromne wyzwanie ekonomiczne i planistyczne, jednakże już dzisiaj zapadają pierwsze decyzje dotyczące planów budowy instalacji kolei próżniowej.

11. Lab-on-a-chip

Wykonując ilościowe badania mikrobiologiczne standardowymi metodami musimy liczyć się z tym że, na ich wyniki będziemy musieli czekać przynajmniej 24 godziny, a w przypadku niektórych patogenów (np. grzyby) nawet kilka-kilkanaście dni. Wynika to z faktu, iż dla klasycznych posiewów na szalce Petriego należy inkubować kolonie komórkowe do czasu aż osiągną one makroskopowe rozmiary, pozwalające na zliczenie ich liczby gołym okiem. Ta skrajnie archaiczna metoda, nie przystająca do współczesnych realiów, jest jednak wciąż najpowszechniejszym sposobem analizy mikrobiologicznej zarówno w  diagnostyce medycznej jaki i w przemyśle spożywczym, farmaceutycznym i kosmetycznym. Sytuacja ta ma jednak szansę ulec zmianie za sprawą rozwiązań typu lab-on-a-chip, czyli miniaturowych systemów analitycznych. Układy tego typu mogą np. wykrywać i zliczać pojedyncze bakterie, eliminując konieczność długotrwałego oczekiwania na wyniki

shutterstock_311155133-1068x601
Przykład mikrofluidycznego układu lab-on-a-chip. Źródło

badań mikrobiologicznych (wymagających odczekania kilkunastu/kilkudziesięciu cykli podziałów komórek).  Układy lab-on-a-chip zazwyczaj wykorzystują rozwiązania mikroprzepływowe (tzw. układy mikrofluidyczne) pozwalające na przeprowadzanie reakcji chemicznych czy też biochemicznych, operując na objętościach płynów rzędu mikro litrów lub mniejszych. Układy tego typu wykonuje się zazwyczaj metodami litograficznymi w płytce ze szkła akrylowego (zdjęcie powyżej). Szczególną klasą systemów mikroprzepływowych są modele organów tzw. organ-on-a-chip. Przykładu rozwiązania lab-on-a-chip dostarczają również miniaturowe układy do sekwencjonowania DNA, wspomniane w punkcie 4. Miniaturyzacja i obniżenie kosztu układów diagnostycznych doprowadzi do ich szerokiego rozpowszechnienia. Będzie to miało duże znaczenie dla podniesienia poziomu diagnostyki medycznej w rozwijających się rejonach świata. Układy lab-on-a-chip  nie tylko (jako np. przystawki do smartfonów) trafią do naszych domów ale również umożliwią prowadzenie badań biomedycznych w warunkach kosmicznych, co już ma miejsce. Połączenie rozwiązań nanosatelitarnych (dyskutowanych w punkcie 2) z układami  lab-on-a-chip  może, w szczególności, dostarczyć metody opracowywania leków dedykowanych dla przyszłych kosmicznych eksploratorów [Ref].

12. Blockchain 

Blockchain to rozproszona baza danych (księga rachunkowa) nie posiadająca centralnej jednostki autoryzującej. Pomimo, że koncepcja ta była znana już wcześniej, szerokie zastosowanie znalazła dzięki kryptowalucie Bitcoin, której założenia zostały przedstawione w 2009-tym roku w pracy Bitcoin: A Peer-to-Peer Electronic Cash System. Wprowadzenie Bitcoina pociągnęło za sobą utworzenie wielu konkurencyjnych kryptowalut, których (na giełdach kryptowalut) notowanych jest już kilka tysięcy.  Funkcjonowanie Blockchainu wymaga zastosowania szeregu rozwiązań kryptograficznych, zapewniających poprawne funkcjonowanie systemu. Są to zarówno

untitled-design
Popularne kryptowaluty oparte o technologię Blockchain. Źródło

podpis elektroniczny, wykorzystywany do uwierzytelniania transakcji,  jak i funkcje haszujące mające zastosowanie do tworzenia adresów bloków oraz w procesie tzw. kopania (mining). Kopanie jest związane z metodą nagradzania osób, które angażują się w podtrzymywanie Blockchainu, co jest niezbędne do jego funkcjonowania. W przypadku Bitcoina,  stosowana jest funkcja haszująca SHA-256, która jest bardzo powszechnie wykorzystywana w zabezpieczaniu np. wymiany informacji w internecie (kliknij na kłódkę w przeglądarce w pasku adresu tej strony i zwróć uwagę na szczegóły certyfikatu TLS). Proces kopania, czyli poszukiwania rozwiązania zadania opartego o przeszukiwanie dziedziny funkcji haszującej, jest jednak zadaniem bardzo żmudnym i wymagającym ogromnych mocy obliczeniowych. Tylko w przypadku Bitcoina (jak wskazuje Bitcoin Energy Consumption Index) roczna konsumpcja energii elektrycznej wynosi około 50 TWh, co przekłada się na średnią pobieraną moc 5,7 GW. Jest to porównywalne z mocą pięciu elektrowni atomowych lub całkowitym zapotrzebowaniem na energię elektryczną Singapuru. Ponieważ energia ta pochodzi jednak w głównej mierze z elektrowni węglowych, tak duża konsumpcja energii rodzi obawy związane z emisją dwutlenku węgla i jego negatywnego wpływu na klimat [Ref].  Problem ten będzie musiał znaleźć rozwiązanie w przyszłych implementacjach technologii Blockchain. Kolejnym problemem, jaki stoi przed stabilnością rozwiązań opartych o Blockchain jest kwestia podatności na ataki na wykorzystane rozwiązania kryptograficzne. Kwestię tę dyskutuję dokładniej we wpisie Kryptowaluty-Kwanty-Kosmos. Rzecz mianowicie dotyczy nowych możliwości zarówno rekonstrukcji kluczy prywatnych (w tzw. kryptografii asymetrycznej) jak i przeszukiwania dziedzin funkcji haszujących, jakich dostarczą komputery kwantowe, dyskutowane w punkcie 1.  Przyszłe implementacje Blockchainu będą wymagały zastosowania klasycznych algorytmów kryptograficznych nie podatnych na ataki kwantowe. Algorytmy takie są dzisiaj opracowywane w ramach tak zwanej kryptografii postkwantowej.  Ponadto, rozwój internetu kwantowego (dyskutowanego w punkcie 7) pozwoli na wprowadzenie Blockchainu opartego o kwantową dystrybucję klucza. Prace nad kwantowo zabezpieczoną wersją Blockchainu są już obecnie prowadzone [Ref]. Warto na koniec podkreślić, że Blockchain ma zastosowanie nie tylko w obszarze finansowym. Do przyszłych pól implementacji tej technologii możemy zaliczyć m.in.: przechowywanie danych medycznych, ubezpieczenia, zarządzanie infrastrukturą IoT, elektroniczne zawieranie umów, księgi wieczyste, kontrola nad prawami do utworów artystycznych oraz zarządzanie łańcuchami dostaw.

© Jakub Mielczarek

Kauzalne Dynamiczne Triangulacje

W 1948-tym roku, w artykule Space-Time Approach to Non-Relativistic Quantum Mechanics, Richard Feynman wprowadził nowatorskie podejście do mechaniki kwantowej, oparte o tak zwane całki po trajektoriach. W jego oryginalnym sformułowaniu, amplituda prawdopodobieństwa przejścia cząstki punktowej z pozycji x_i w chwili t_i do pozycji x_f w chwili x_f wyraża się poprzez następującą całkę:

\langle x_f, t_f |x_i, t_i \rangle = \int D x(t) e^{\frac{i}{\hslash} S[x(t)]},

gdzie S[x] to tak zwane działanie, będące funkcjonałem trajektorii x od punktu (t_i,x_i) do punktu (t_f,x_f). Działanie wyraża się poprzez funkcję Lagrange’a L (lagranżjan) w następujący sposób:

S[x(t)] = \int_{t_i}^{t_f} dt L(x(t),\dot{x}(t),t) .

Sformułowanie całek po trajektoriach mówi nam, że amplituda prawdopodobieństwa (tzw. propagator) \langle x_f, t_f |x_i, t_i \rangle jest całką (sumą) po czynnikach fazowych e^{\frac{i}{\hslash} S[x(t)]} dla wszystkich możliwych trajektorii x(t) biegnących od (t_i,x_i) do (t_f,x_f). Praktyka wygląda jednak nieco inaczej i w obliczeniach uwzględniane są zazwyczaj jedynie trajektorie które nie łamią przyczynowości (kauzalności).  Są to trajektorie które, w swoje drodze od x_i do  x_f, nie cofają się nigdy wstecz w czasie.  Obrazuje to rysunek poniżej:

pathintegral
Trajektorie kauzalne i akauzalne. 

Niebieskie krzywe na powyższym rysunku to trajektorie kauzalne. Dla tych trajektorii, w dowolnej chwili czasu, np. dla t_2, cząstka istnieje tylko w jednym miejscu, oznaczonym jako szary punkt. Dla porównania, czerwona krzywa przedstawia trajektorię akauzalną, dla której, w przedziale od t_3 do t_1, następuje cofanie się w czasie. Alternatywnie, możemy tę trajektorię zinterpretować w następujący sposób: Mianowicie, idąc w przód w czasie, od  t_i aż do chwili t_1,  mamy jedną cząstkę. Natomiast, w chwili  t_1 następuje kreacja cząstki i antycząstki. Przy czym, antycząstka porusza się wstecz w czasie i anihiluje z wyjściową cząstką w chwili t_3. Natomiast, powstała w chwili  t_1 cząstka podąża trajektorią kauzalną aż do t_f. Uwzględnienie procesów kreacji i anihilacji cząsteczek wychodzi, jednakże, poza opis cząstkowy i wymaga odwołania się do opisu w języku kwantowej teorii pola. Opis całek po trajektoriach dla cząstek nie jest więc wystarczający do tego by opisać trajektorie akauzalne, dla których możemy w pewnych momentach (np. w chwili t_2) obserwować więcej niż jedną cząstkę (np. w chwili t_2 mamy ich 3). Warto tu wspomnieć, że Richard Feynman jeszcze w czasach przed powstaniem nowoczesnej kwantowej teorii pola (której sam był współtwórcą) zastanawiał się nad znaczeniem akauzalnych trajektorii.  Opisuje to James Gleick w książce biograficznej Feynmana pt. “Geniusz”. Feynman miał mianowicie pomysł, iż wszystkie cząstki i antycząstki danego typu (np. elektrony i pozytony) są częścią jednej bardzo długiej pozawijanej w czasoprzestrzeni trajektorii. Przy czym, jej częściom skierowanym w przód w czasie odpowiadają cząstki, natomiast odcinkom skierowanym w tył w czasie odpowiadają antycząstki. Zmiany zwrotu takiej trajektorii w czasie (tak jak w t_1 i t_3 na rysunku powyżej) interpretujemy zaś jako kreacja lub anihilacja par cząstka-antycząstka. Obraz ten możemy, jedynie do pewnego stopnia, zachować w ramach współczesnej kwantowej teorii pól. W szczególności, antycząstki faktycznie można opisywać jako poruszające się wstecz w czasie cząstki (w sensie zadziałania na stan cząstki operacjami inwersji w czasie oraz parzystości). Nie wchodząc w dalsze szczegóły pomysłu Feynmana, zwróćmy jeszcze jedynie uwagę na kwestię prędkości, czyli pochodnej położenia po czasie, v = \frac{dx}{dt}. Na powyższym rysunku, różniczkowalność trajektorii  (brak “kolców”) powoduje, że zbliżając się do punktów w t_1 i t_3 dla (czerwonej) trajektorii akauzalnej, prędkość v dąży do plus lub minus nieskończoności (w zależności od której strony dochodzimy do punktu zwrotu).  To zaś jest w sprzeczności ze Szczególną Teorią Względności która, poprzez lorentzowską geometrię czasoprzestrzeni Minkowskiego, wprowadza górne ograniczenie na prędkość rozchodzenia się informacji, równe prędkości światła w próżni.

Ograniczenie na prędkość propagacji nie istniałoby, gdyby czasoprzestrzeń posiadała geometrię euklidesową. Choć wiemy, że w rzeczywistości tak nie jest, okazuję się jednak, że przejście z czasoprzestrzeni Minkowkiego do przestrzeni euklidesowej ma znacznie na gruncie rozważań teoretycznych.  Mianowicie, rozpatrywanie euklidesowych wersji teorii pozwala na analizę tak zwanych instantonów. Są to, dla cząstek,  rozwiązania w odwróconej studni potencjału, czyli w obszarach do których klasyczne cząstki nie mają dostępu. Rozważanie instantonów, w szczególności, pozwala wyznaczać prawdopodobieństwa tunelowania kwantowego.

Wick
Obrót Wicka na płaszczyźnie zespolonej.

Technicznie, przejście z czasoprzestrzeni Minkowskiego do przestrzeni euklidesowej możemy przeprowadzić za pomocą  obrotu Wicka.  Jest to przykład tak zwanego przedłużenia analitycznego, rozszerzającego rzeczywistą zmienną czasową t do dziedziny liczb zespolonych.  W tym szczególnym przypadku, dokonujemy zamiany t \rightarrow i \tau, gdzie \tau jest naszą nową (euklidesową) zmienną czasową, zaś i to jednostka urojona (i^2=-1). Obrót Wick ma bardzo ważne znacznie w podejściu całek po trajektoriach. Przekształca on mianowicie zespoloną całkę do postaci przypominającej rzeczywistą sumę statystyczną Z(T) (ang. partition function), rozważaną w fizyce statystycznej.  Co więcej, okazuje się, że jeśli rozważymy szczególny typ trajektorii w których wracamy do wyjściowego położenia po czasie \frac{\hslash}{k_{B}T}, (gdzie k_B to stała Boltzmanna) całka po trajektorii da nam dokładnie funkcję rozdziału dla temperatury T:

Z(T) = \int dx  \langle x, i \frac{\hslash}{k_{B}T} |x, 0 \rangle  = \oint D x(t) e^{-\frac{1}{\hslash} S_E[x(t)]},

gdzie S_E[x(t)] = -i S[x(t)] to tzw. działanie euklidesowe. Natomiast, przy całkowaniu \oint, spełniony jest warunek x(\tau=0)=x(\tau=\frac{\hslash}{k_{B}T}). Jest to ważny wynik gdyż pozwala rozpatrywać  całki po trajektoriach jako pewne układy statystyczne i stosować do ich obliczania metody znane z fizyki statystycznej. W szczególności, chodzi o symulacje komputerowe oparte na metodach Monte Carlo. Stan równowagi termodynamicznej takiego układu można natomiast związać z euklidesową trajektorią klasyczną (minimalizującą działanie S_E[x(t)]). Fluktuacje termiczne dualnego systemu statystycznego odpowiadają zaś fluktuacjom kwantowym wokół rozważanej wyjściowo trajektorii klasycznej.

Powyższe rozważania możemy zastosować nie tylko do cząstek, ale również do pól fizycznych, takich jak pole grawitacyjne. W przypadku grawitacji, całki po trajektoriach pozwalają analizować możliwe efekty kwantowej natury zjawisk grawitacyjnych. Jednym z najlepiej zbadanych podejść do grawitacji kwantowej, bazującym na całkach po trajektoriach, są tak zwane Kauzalne Dynamiczne Triangulacje (ang. Causal Dynamical Triangulations – CDT), wprowadzone przez Jana Ambjørna, Jerzego Jurkiewicza oraz Renate Loll i rozwijane już przez ponad 20 lat.  W przypadku tym, zamiast cząstki, rozważamy konfigurację pola grawitacyjnego, której odpowiada geometria przestrzenna. Rozważania w  ramach CDT przeprowadzono najpierw dla przypadku modelu przestrzeni jednowymiarowej, po czym uogólniono je do dwóch oraz, finalnie, trzech wymiarów przestrzennych.

Ewolucji geometrii przestrzennej w czasie, odpowiada geometria czasoprzestrzenna. Konfiguracje czasoprzestrzenne, łączące dwa brzegowe (początkowy i końcowy) stany geometrii przestrzennej są zaś naszymi nowymi trajektoriami (analogicznie do przypadku rozważanej wcześniej cząstki punktowej).  Działaniem które należy rozważyć w całkach po trajektoriach jest tak zwane działania Hilberta-Einsteina, z którego można wyprowadzić (korzystając z zasady najmniejszego działania) równania ogólnej teorii względności (OTW). Do działania grawitacyjnego, można również dodać wkład odpowiadający polom materii, co jednak wprowadza dodatkowe komplikacje. W związku z tym, w przeprowadzonych dotychczas rozważaniach, koncentrowano się na tzw. przypadku próżniowym, uwzględniającym kontrybucję od (dodatniej) stałej  kosmologicznej \Lambda. Całkowite działanie ma, w tym przypadku, postać:

S= \frac{1}{16 \pi G} \int_{\mathcal{M}} d^4x \sqrt{-det(g)} (R-2\Lambda),

gdzie całkowanie odbywa się po rozmaitości \mathcal{M} z brzegami czasowymi \mathcal{B}_{i} oraz \mathcal{B}_{f}. Natomiast, G to stała Newtona, R jest skalarem krzywizny Ricciego, det(g) oznacza zaś wyznacznik z metryki czasoprzestrzennej g_{\mu\nu}.

W przypadku CDT, powyższe działanie poddawane jest obrotowi Wicka, umożliwiając przejście do geometrii euklidesowej. Z jednej strony, zabieg taki przeprowadza zespolony propagator do postaci rzeczywistej funkcji rozdziału, prowadząc do wspomnianego związku z fizyką statystyczną. Z drugiej jednak strony, geometria czasoprzestrzenna pozbawiana  zostaje stożków świetlnych, co pozwala na obecność akauzalnych wkładów do całki po trajektoriach.  Idea CDT opiera się na narzuceniu kauzalności trajektorii, pomimo rozważania teorii, wydawałoby się, euklidesowej. Wprowadzenie warunku kauzalności usuwa z całki po trajektoriach “gałęzie” odchodzące z głównego “pnia” czasoprzestrzeni łączącej stan początkowy | \mathcal{B}_{i} \rangle ze stanem końcowym | \mathcal{B}_{2} \rangle. Przedstawiono to na poniższym rysunku:

cdtpath2
Przykładowa trajektoria geometrii od konfiguracji początkowej | \mathcal{B}_{i} \rangle do konfiguracji końcowej | \mathcal{B}_{2} \rangle. W ramach Kauzalnych Dynamicznych Triangulacji, nie są dozwolone akauzalne rozgałęzienia geometrii.

Jedynie w przypadku jednowymiarowej części przestrzennej możliwe okazało się uzyskanie amplitud prawdopodobieństwa w oparciu o obliczenia analityczne. Zbadania przypadków wyżej-wymiarowych, w tym tego odpowiadającego  czterowymiarowej czasoprzestrzeni, wymaga zastosowania metod numerycznych. Przeprowadzenie symulacji kwantowych ciągłych geometrii wymaga jednakże ich wcześniejszej dyskretyzacji, w celu zredukowania liczby stopni swobody. W praktyce, stosowana jest tak zwana dyskretyzacja Regge, bazująca na triangulacji ciągłej geometrii czasoprzestrzennej. Przygotowana w ten sposób dyskretna geometria, wraz z dyskretną wersją działania, stanowi punkt wyjścia do przeprowadzenia symulacji komputerowych.

Narzucenie na (dyskretne) trajektorie warunku kauzalności, przekłada się na zachowanie w czasie ich topologii. Na przykład, jeśli wyjściowa geometria przestrzenna posiada topologię okręgu \mathbb{S} (jak na rysunku powyżej), pozostaje nią w całym toku ewolucji. Złamanie kauzalności, poprzez  pojawienie się odnóg, powoduje że topologia przestrzenna ulega zmianie, na przykład poprzez rozszczepienie okręgu na dwa okręgi. Sytuację taką widzimy w dolnej części, umieszczonego powyższej, rysunku.

Najbardziej zaawansowane na świecie symulacje CDT przeprowadzane są od wielu lat w Zakładzie Teorii Układów Złożonych w Instytucie Fizyki  na Uniwersytecie Jagiellońskim w Krakowie. W symulacjach tych, przyjmuje się topologię przestrzenną 3-sfery (\mathbb{S}^3), bądź też trójwymiarowego torusa (\mathbb{S}\times \mathbb{S}\times \mathbb{S}). Przy czym, przypadek topologii 3-sfery został, jak dotąd, najlepiej przebadany i na dyskusji, otrzymanych dla niego, wyników się tutaj skupimy.

Pierwszym ważnym rezultatem przeprowadzonych symulacji jest wykazanie istnienia nietrywialnej struktury fazowej czasoprzestrzeni. Zagadnie to dyskutuję w moim wcześniejszym wpisie  “Stany skupienia grawitacji“. Jedna z obserwowanych faz, tak zwana faza C, odpowiada przypadkowi semi-klasycznemu, który koresponduje z rozwiązaniami klasycznej OTW. Ważną własnością fazy C jest to, że jej wymiar,  na odpowiednio dużych skalach, równy jest 4, co jest zgodne z przypadkiem czterowymiarowej czasoprzestrzeni w której żyjemy. Jednakże, analiza tak zwanego wymiaru spektralnego (ang. spectral dimension), wskazuje na to że wymiar spada kiedy rozpatrujemy odpowiednio małe skale przestrzenne i czasowe [Ambjorn, Jurkiewicz & Loll (2005)]. Jest to tak zwana redukcja wymiarowa, spotykana również w innych podejściach do kwantowej grawitacji. Redukcja wymiarowa wskazuje na to, że choć na odpowiednio dużych skalach geometria fazy C zgodna jest z euklidesową wersją czasoprzestrzeni de Sittera, to jednak na małych skalach wykazuje ona naturę kwantową. Dlatego też, określamy ją mianem semi-klasycznej, czyli korespondującej z fizyką klasyczną, jednakże wciąż wykazującą pewne własności kwantowe. Poniżej przedstawiono jak wygląda przykładowa semi-klasyczna trajektoria otrzymana w ramach komputerowych symulacji CDT.

CDT
Przykładowa trajektoria instantonowa, otrzymana w ramach Kauzalnych Dynamicznych Triangulacji.  Źródło

Jak należy rozumieć przedstawiony powyżej kształt? Po pierwsze, uściślijmy, że oś symetrii rotacyjnej powyższej geometrii odpowiada czasowi urojonemu \tau. Po drugie, w czasie tym narzucony jest symetryczny warunek brzegowy \mathcal{B}(\tau_i)=\mathcal{B}(\tau_f), wymagany w przypadku przejścia od całek po trajektoriach do funkcji rozdziału Z(T).

Okazuje się, że otrzymany kształt dla trajektorii semi-klasycznej (odpowiadającej stanowi równowagi termodynamicznej w ujęciu fizyki statystycznej) zgodny jest z rozwiązaniem dla klasycznego instantonu de Sittera. Instanton ten jest euklidesową trajektorią (pod barierą potencjału) dla modelu de Sittera w zakresie czynnika skali a \in [0,a_0], gdzie a_0 = \sqrt{\frac{3}{\Lambda}}. Aby otrzymać równanie trajektorii instantonowej, rozważmy wszechświat de Sittera (metryka FRW z dodatnią stałą kosmologiczną oraz dodatnią krzywizną przestrzenną), dla którego równanie Friedmanna przyjmuje postać:

\left(\frac{\dot{a}}{a} \right)^2 = \frac{\Lambda}{3} - \frac{1}{a^2}.

Rozwiązaniem tego równania jest funkcja hiperboliczna a(t) = a_0 \cosh (t/a_0). Jest to przykład nieosobliwej ewolucji, reprezentującego wszechświat ulegający najpierw kontrakcji, aż do minimalnej wartości czynnika skali równej  a_0, po czym następuje etap ekspansji. Zarówno kontrakcja jak i ekspansja przebiegają w sposób wykładniczy.

Niedozwolonym obszarem dla wprowadzonego powyżej przypadku lorentzowkiego jest przedział czynnika skali a \in [0,a_0), znajdujący się pod barierą potencjału dla tego modelu. Jednakże, dokonując  obrotu Wicka t \rightarrow i \tau przekształcamy rozwiązanie w postaci funkcji cosinus hiperboliczny do funkcji cosinus:

a(\tau) = a_0 \cos (\tau/a_0),

tak, że a \in [0,a_0]. Jest to poszukiwane rozwiązanie euklidesowe, dla obszaru pod barierą potencjału modelu lorentzowskiego. Ponieważ czynniki skali a jest zdefiniowany jako wartość nieujemna, rozwiązanie instantonowe jest dobrze określone w  skończonym przedziale czasu urojonego:  \tau \in [- \frac{\pi}{2}a_0, \frac{\pi}{2}a_0]. Znając ewolucję czynnika skali możemy wyznaczyć również ewolucję objętości, która wyraża się jako  V(\tau) = 2 \pi^2 a^3(\tau) =2 \pi^2 a^3_0 \cos^3 (\tau/a_0). Okazuje się, że funkcja ta jest zgodna z wynikami symulacji przeprowadzonymi w ramach CDT. Mówiąc ściślej, pokrywa się ona z, otrzymaną z uśrednienia po trajektoriach, zależnością objętości części przestrzennej od czasu \tau [Ambjorn, Jurkiewicz & Loll (2004)].

Pokrywanie się przewidywań CDT z klasyczną geometrią przestrzeni de Sittera to bardzo istotny rezultat. Pokazuje on, że jednorodna i izotropowa klasyczna czasoprzestrzeń może wyłonić się jako wynik uśrednienia kwantowych (często bardzo niejednorodnych) trajektorii. Ponadto, w przeciągu ostatnich lat pokazano, że również przewidywane w ramach CDT fluktuacje kwantowe instantonu są z godne z przewidywaniami analitycznymi bazującymi o model de Sittera [Ambjorn, Gorlich, Jurkiewicz & Loll (2008)]. Wyniki te, jak również rezultaty dotyczące struktury fazowej grawitacji oraz redukcji wymiarowej, dają impuls do tego by zacząć myśleć o weryfikacji empirycznej przewidywań CDT. O ile trudno tu mówić o wykorzystaniu naziemnych eksperymentów, to przewidywania dotyczące kosmologii wczesnego wszechświata rodzą pewne nadzieje na narzucenie więzów obserwacyjnych na przewidywania CDT.

Pierwszy krok w tym kierunku poczyniłem w moim artykule From causal dynamical triangulations to astronomical observationsEPL 119 (2017) no. 6, 60003 [arXiv:1503.08794], w którym rozważałem możliwość wykorzystania obserwacji mikrofalowego promieniowania tła do badania, przewidywanej w ramach CDT,  redukcji wymiarowej. Jak pokazały obliczenia, pewne szczególne (mało prawdopodobne) scenariusze ewolucji wczesnego wszechświata, uwzględniające przewidywania CDT, już dzisiaj można wykluczyć na postawie obserwacji astronomicznych. Dokonanie znaczącego postępu w tym kierunku w najbliższych latach, nie będzie jednak zadaniem łatwym.

Niezależnie jednak od możliwości weryfikacji empirycznej, zaawansowane symulacje komputerowe kwantowej czasoprzestrzeni, prowadzone w ramach Kauzalnych Dynamicznych Triangulacji, dają nam unikalną możliwość zrozumienia tego jak klasyczna czasoprzestrzeń może wyłaniać się z dynamiki ogromnej liczby kwantowych “cegiełek” na skali Plancka. Wszak jak pozostawił napisane na swojej tablicy Richard Feynman: “What I cannot create, I do not understand.”

© Jakub Mielczarek

Zwarte przestrzenie fazowe

Jednym z zagadnień, nad którym obecnie pracuję, jest konstrukcja teorii pól z tak zwanymi zwartymi przestrzeniami fazowymi. Teorie takie są uogólnieniem powszechnie rozważanych w fizyce teoretycznej teorii z afinicznymi (płaskimi) przestrzeniami fazowymi. Kierunek badawczy związany z uzwarcaniem przestrzeni fazowych pól fizycznych zainicjowaliśmy, wspólnie z dr Tomaszem Trześniewskim, w 2016-tym roku w pracy “The Nonlinear Field Space Theory” Phys. Lett. B 759 (2016) 424 (open access). Badania te kontynuujemy obecnie w ramach grantu Sonata Bis 7 z NCN pt. “Teorie pola ze zwartymi przestrzeniami fazowymi − od grawitacji do układów złożonych”. Jednym z ambitnych celów tego projektu jest zbudowanie (kwantowej) teorii grawitacji, cechującej się zwartą przestrzenią fazową. O wynikach prowadzonych przez nas badań napiszę więcej w jednym z kolejnych wpisów. Tutaj zaś chciałbym przygotować niezbędną podbudowę teoretyczną do dyskusji  naszych dotychczasowych rezultatów. Przedstawię mianowicie ideę zwartej przestrzeni fazowej na przykładzie układu fizycznego z jednym stopniem swobody, co można uważać za teorię pola skalarnego w punkcie (w przestrzeni zerowymiarowej).

Rozważmy więc pojedynczy stopień swobody, opisywany zmienną q. Wartości q należą do, tak zwanej, przestrzeni konfiguracyjnej \mathcal{C}, którą wyjściowo przyjmijmy za zbiór liczb rzeczywistych, \mathcal{C} = \mathbb{R}. Zmienna q może więc przyjmować dowolną wartość z zakresu liczb rzeczywistych i opisywać stopień swobody wybranego układu fizycznego. Jeśli, na przykład, interpretujemy q jako wartość pola skalarnego w punkcie, to wybór \mathcal{C} = \mathbb{R} oznacza, że pole to może zmieniać swoją wartość w zakresie od - \infty do +\infty. Jeśli zaś q opisuje położenie cząstki, to wybór \mathcal{C} = \mathbb{R} mówi nam, że mamy do czynienia z ruchem w jednym wymiarze przestrzennym, po całej osi liczb rzeczywistych.

Do pełnego scharakteryzowani stanu cząstki nie wystarczy podanie jej położenia. Tak samo, do określenia stanu pola nie wystarczy znajomość jego wartości. W obydwu przypadkach, konieczne jest określenie również tego jak q zmienia się w czasie. Informację tę zawiera, sprzężony z q, pęd kanoniczny p. Pary (q,p) wyznaczają zaś punkty należące do, tak zwanej, przestrzeni fazowej \Gamma. Z geometrycznego punktu widzenia, przestrzeń fazowa jest zazwyczaj tzw. wiązką kostyczną do przestrzeni konfiguracyjnej:

\Gamma = T^*(\mathcal{C}) := \left\{ (q,p) : q \in \mathcal{C}, p \in T_q^*(\mathcal{C}) \right\} ,

gdzie T_q^*(\mathcal{C})  to przestrzeń kostyczna do przestrzeni \mathcal{C} w punkcie q. Dla rozważanego przypadku \mathcal{C} = \mathbb{R}, otrzymujemy \Gamma = T^*(\mathcal{C}) = \mathbb{R} \times \mathbb{R} = \mathbb{R}^2, czyli płaszczyznę rzeczywistą. Dowolny punkt na tej płaszczyźnie reprezentuje stan układu klasycznego. Ewolucji układu w czasie odpowiadają zaś trajektorie (rysunek poniżej).

PhaseSpace
Przestrzeń fazowa \Gamma = T^*(\mathcal{C}) = \mathbb{R}^2, gdzie \mathcal{C}= \mathbb{R}T_{q_0}^*(\mathcal{C}) to przestrzeń kostyczna do przestrzeni \mathcal{C} w punkcie q_0. Wiązka kostyczna jest sumą rozłączną przestrzeni kostycznych dla wszystkich q_0 \in \mathcal{C}. Czarna trajektoria reprezentuje ewolucję układu w czasie. Niebieski punkt wskazuje na jednen ze stanów układu.

Istnieją jednak przypadki w których przestrzeni fazowej nie możemy wyrazić jako wiązki kostycznej  \Gamma = T^*(\mathcal{C}). Przykładem tego jest chociażby (zwarta) przestrzeń fazowa o geometrii sfery, którą przedyskutujemy dokładniej w dalszej części.  Przypadek ten wpisuje się natomiast w ogólną definicję przestrzeni fazowych, jako tak zwanych rozmaitości symplektycznych, czyli rozmaitości różniczkowych posiadających zamknięte formy różniczkowe

\omega = \frac{1}{2} \omega_{ij} dx^i \wedge dx^j,

gdzie, dla rozważanej wcześniej przestrzeni fazowej  \Gamma = \mathbb{R}^2, i =1,2 oraz x_1=q i x_2=p a forma różniczkowa przyjmuje postać \omega = dp \wedge dq. Symbol \wedge oznacza tak zwany iloczyn zewnętrzny (ang. exterior product) form różniczkowych, w rozważanym przypadku 1-formy dp oraz 1-formy dq. Zamkniętość  2-formy \omega oznacza zaś, że d\omega = d(dp \wedge dq) = 0. Niniejsza własność gwarantuje spełnienie tzw. tożsamości Jacobiego, która zaś implikuje łączność algebry Poissona. Algebra ta konstruowana jest w oparciu o nawias Poissona \{f,g\} :=\mathcal{P}^{ij}(\frac{\partial f}{\partial x^i})(\frac{\partial g}{\partial x^j}), gdzie \mathcal{P}^{ij} :=(\omega^{-1})^{ij} to tak zwany tensor Poissona, otrzymywany przez  odwrócenie formy symplektycznej \omega (co nie zawsze jest możliwe). Dla rozważanego przypadku \Gamma = \mathbb{R}^2, nawias ten wyraża się jako \{f,g\} = \frac{\partial f}{\partial q} \frac{\partial g}{\partial p}- \frac{\partial f}{\partial p} \frac{\partial g}{\partial q} , tak że dla pary kanonicznie sprzężonych zmiennych q i p otrzymujemy \{q, p\}=1. Wykorzystując nawias Poissona, możemy wprowadzić równanie Hamiltona \frac{df}{dt} = \{f, H\}+\frac{\partial f}{\partial t}, gdzie H jest tak zwaną funkcją Hamiltona (hamiltonianem), zaś f jest dowolną funkcją na przestrzeni fazowej. Równanie to opisuje ewolucję w czasie t układu fizycznego.

Płaskie (afiniczne) przestrzenie fazowe, tak  jak rozważany tu przypadek \Gamma = \mathbb{R}^2 mają szerokie zastosowanie do opisu świata fizycznego. Jednakże, w wielu przypadkach, nieograniczoność tych przestrzeni prowadzi do trudności. Na przykład,  w przypadku teorii pól, afiniczność przestrzeni fazowej przekłada się na nieograniczoność energii (hamiltonianu), będącej funkcją zmiennych fazowych. To zaś skutkuje możliwością pojawienia się niefizycznych nieskończoności. Lista potencjalnych problemów jest dłuższa. Możliwym sposobem na ich rozwiązanie jest uzwarcenie przestrzeni fazowej. Poniżej, przedstawię jak taka procedura  wygląda w przypadku \Gamma = \mathbb{R}^2 (płaszczyzna) uzwarconej do \Gamma = S^2 (sfera).

Rozważmy zatem sferyczną przestrzeń fazową, tak by w granicy gdy jej promień dąży do nieskończoności, odzyskiwać przypadek przestrzeni fazowej  \Gamma = \mathbb{R}^2. Innymi słowy, płaska przestrzeń fazowa będzie lokalnym przybliżeniem dla przestrzeni sferycznej,  w podobny sposób jak geometria euklidesowa jest lokalnym przybliżeniem dla (nieeuklidesowej) geometrii sferycznej.  Zamiast jednak rozważać kąty i długości, w przypadku przestrzeni fazowej obiektem naszego zainteresowania będzie forma symplektyczna \omega.

Naturalnym wyborem formy symplektycznej dla sfery jest 2-forma powierzchni \omega = S \sin \theta d \phi \wedge d \theta. Kąty \phi \in (-\pi, \pi] oraz \theta \in [0,\pi] to standardowe kąty w sferycznym układzie współrzędnych. Stała S została zaś wprowadzona ze względów wymiarowych, tak by forma symplektyczna  \omega miała wymiar powierzchni na płaszczyźnie fazowej 2D, czyli położenie razy pęd (= moment pędu). W celu wyrażenia tej formy poprzez zmienne q oraz p, wykorzystywane w przypadku \Gamma = \mathbb{R}^2, wykonajmy następującą zmianę zmiennych:

\phi = \frac{q}{R_1}  oraz  \theta = \frac{\pi}{2}-\frac{p}{R_2},

gdzie R_1 i R_2 to parametry wprowadzone ze względów wymiarowych. Stosując to do formy \omega = S \sin \theta d \phi \wedge d \theta, otrzymujemy:

\omega= \frac{S}{R_1R_2} \cos\Big(\frac{p}{R_2}\Big)dp\wedge dq.

Chcąc by w granicy R_1\rightarrow \infty oraz R_2 \rightarrow \infty, powyższa forma redukowała się do przypadku płaskiego, czyli \omega=dp\wedge dq, musimy przyjąć by S = R_1 R_2.

Sphere
Afiniczna (płaska) przestrzeń fazowa \Gamma = \mathbb{R}^2 może być rozpatrywana jako lokalne przybliżenie zwartej przestrzeni fazowej, na przykład o geometrii sfery \Gamma = S^2.

Spełnienie warunku poprawnej granicy afinicznej implikuje więc, że 2-forma \omega dla (zwartej) sferycznej przestrzeni fazowej ma postać:

\omega=\cos\Big(\frac{p}{R_2}\Big)dp\wedge dq.

Podobnie, jak w rozważanym wcześniej przypadku \Gamma = \mathbb{R}^2, w oparciu o formę symplektyczną możemy wyznaczyć postać nawiasu Poissona dla sferycznej przestrzeni fazowej:

\{f,g\} =  \frac{1}{\cos\Big(\frac{p}{R_2}\Big)}\left( \frac{\partial f}{\partial q} \frac{\partial g}{\partial p}- \frac{\partial f}{\partial p} \frac{\partial g}{\partial q}\right).

Różnica z przypadkiem \Gamma = \mathbb{R}^2 polega na obecności czynnika 1/\cos\Big(\frac{p}{R_2}\Big). W konsekwencji, nawias Poissona pomiędzy zmiennymi kanonicznymi przyjmuje postać \{q,p\} =  1/\cos\Big(\frac{p}{R_2}\Big).  Warto tu podkreślić, że zmienne q oraz p są dobrze zdefiniowane na sferze jedynie lokalnie.  Ich wartości nie zmieniają się na sferze w sposób ciągły. W szczególności, q \in (-\pi R_1, \pi R_1], tak że w puncie q= \pi R_1 następuje nieciągłość.  O ile, nie ma to znaczenia w przypadku kiedy rozważamy małe wartości q (w otoczeniu granicy afinicznej), tak w przypadku analizy globalnych własności sferycznej przestrzeni fazowej zasadne jest wprowadzenie zmiennych które zdefiniowane są w sposób globalny.  Naturalnym wyborem takich zmiennych jest parametryzacja sfery w kartezjańskim układzie współrzędnych. Dowolny punkt na sferze może być więc wskazywany przez wektor \vec{S}=(S_x,S_y,S_z) o składowych:

S_x:= S \sin\theta \cos\phi = S \cos \left( \frac{p}{R_2} \right) \cos \left( \frac{q}{R_1} \right),

S_y:= S \sin\theta \sin\phi = S \cos \left( \frac{p}{R_2} \right) \sin \left( \frac{q}{R_1} \right),

S_z:= S \cos\theta = S \sin \left( \frac{p}{R_2} \right).

Przy czym, spełnione jest równanie sfery  \vec{S}\cdot\vec{S}= S_x^2+S_y^2+S_x^2=S^2. Wykorzystując nawias Poissona dla sferycznej przestrzeni fazowej, możemy teraz pokazać że składowe wektora \vec{S} spełniają następującą relacje:

\{S_x,S_y\} = S_z, \ \ \ \{S_z,S_x\} = S_y, \ \ \ \{S_y,S_z\} = S_x.

Jest to tak zwana algebra su(2).  Oznacza to, że składowe wektora \vec{S} są generatorami obrotów, co jest konsekwencją  symetrii sferycznej przestrzeni fazowej. Zgodnie więc z definicją,  wektor \vec{S}, którego składowe spełniają powyższą algebrę, nazywamy momentem pędu (lub spinem). Fakt, iż sferyczna przestrzeń fazowa jest przestrzenią fazową momentu pędu ma daleko idące konsekwencje. W szczególności, obserwacja, że sferyczna przestrzeń fazowa (momentu pędu lub spinu) może być lokalnie opisywana przez płaską przestrzeń fazową z jednym stopniem swobody stała się podstawą do wprowadzenia, przeze mnie w 2017-tym roku, tak zwanej Korespondencji Spin-Pole  (Spin-Field Correspondence).  Korespondencja ta wiąże, w granicy dużego spinu (S\rightarrow \infty), znane afiniczne teorie pola z układami spinowymi. W szczególności, jak pokazaliśmy z moimi współpracownikami z Uniwersytetu Fudan w Szanghaju w pracy  “Klein-Gordon field from the XXZ Heisenberg model” (przyjęte do druku w International Journal of Modern Physics D), pole skalarne Kleina-Gordona można otrzymać z łańcucha spinowego XX Heisenberga (model XXZ Heisenberga w granicy \Delta \rightarrow 0 parametru anizotropii).

Posłużyłem się powyżej określeniem spin, które zarezerwowane jest do określenia wewnętrznego momentu pędu cząstek, bezpośrednio związanego z jej kwantową naturą  i wyrażającego się w ułamkach (n/2, gdzie n = 0,1,2,3,\dots) zredukowanej stałej Plancka \hslash.  Jednakże, jak dotąd, nasze rozważania były skupione na analizie klasycznych przestrzeni fazowych, dla których wartość momentu pędu S pozostawała nieokreślona. Dla kompletności naszych rozważań, zakończymy więc naszą dyskusję zarysem analizy przypadku kwantowego. Mianowicie, w ujęciu kwantowym, stan układu nie jest opisywany przez punkt w przestrzeni fazowej lecz przez wektor w przestrzeni Hilberta (warto tu zaznaczyć, że w podejściu zwanym mechaniką kwantową na płaszczyźnie fazowej, stan kwantowy układu można związać z tak zwaną funkcją gęstości kwaziprawdopodbieństwa (funkcja Wignera) określoną na przestrzeni fazowej). Wymiar przestrzeni Hilberta, czyli ilość liniowo niezależnych wektorów bazowych, wiąże się natomiast z powierzchnią przestrzeni fazowej. Mianowicie, zasada nieoznaczoności Heisenberga mówi nam, że iloczyn nieoznaczoności pomiarów q i p ograniczony jest od dołu w następujący sposób (dla przypadku płaskiej przestrzeni fazowej):

\Delta q \Delta p \geq \frac{\hslash}{2}.

Nie możemy dokładniej wyznaczyć więc klasycznego stanu stopnia swobody na płaszczyźnie fazowej niż jako powierzchni \sim \hslash. Do opisu układu, którego przestrzeń fazowa ma powierzchnię A potrzebujemy więc około A/\hslash niezależnych wektorów w przestrzeni Hilberta. W przypadku płaskiej przestrzeni fazowej, z uwagi na nieskończoność powierzchni, przestrzeń Hilberta musi więc posiadać nieskończony wymiar.  Jednakże, dla przypadku sfery \Gamma=S^2, powierzchnia przestrzeni fazowej jest równa:

A =  \int_{\Omega} \omega = 4 \pi S < \infty,

gdzie wykonano całkowani po pełnym kącie bryłowym \Omega. Wymiar przestrzeni Hilberta jest więc skończony i proporcjonalny do \sim S/\hslash. Ponieważ wymiar przestrzeni Hilberta jest liczbą naturalną, dozwolone są jedynie pewne wartości S, będące wielokrotnością stałej Plancka \hslash. Sama zwartość przestrzeni fazowej implikuje więc kwantowanie momentu pędu (spinu). Dokładny rachunek, wykorzystujący kwantowanie algebry su(2) lub też stosując tak zwane kwantowanie geometryczne sfery, mówi nam, że wymiar przestrzeni Hilberta dla spinu wyraża się jako \text{dim} H_s = 2s+1, gdzie s=0,\frac{1}{2}, 1, \frac{3}{2}, \dots. Natomiast, powierzchnia przestrzeni fazowej wyraża się jako  4 \pi S =4 \pi \hslash s .  Jeśli, na przykład, rozważymy spin elektronu, dla którego s=1/2, odpowiadająca mu powierzchnia przestrzeni fazowej będzie równa 2\pi \hslash.  

© Jakub Mielczarek

Esej o poznawaniu

Doświadczenie czegoś po raz pierwszy ekscytuje lub też spotyka się z brakiem naszej akceptacji dla rzeczy nowej. Powtarzanie zaś przyzwyczaja, prowadząc ostatecznie do znudzenia i zobojętnienia. Jakże ważne jest więc, by rzecz cenną dla naszego umysłu smakować po trochu, unikając poczucia sytości. Błędem i szkodą jest tym samym uczynienie wyjątkowości rzeczą powszednią. Choć powstrzymanie się przed taką pokusą nie jest sprawą prostą i wymaga nie lada dyscypliny.

Umysł ludzki szybko przyzwyczaja się do otoczenia, w którym przychodzi mu funkcjonować. Musi działać i walczyć o przetrwanie. Otoczenie, które prędzej czy później staje się tylko sceną, jest tłem dla aktywności decydujących o naszym losie.

Momentem, w którym to jednak scenografia, a nie sama życiowa rola, wręcz musi być obiektem naszego zainteresowania jest dzieciństwo. Wtedy też silnie kształtuje się świadomość, która osadza nas w otaczającej rzeczywistości. Tak, byśmy mogli w niej właściwie funkcjonować i odgrywać nasze życiowe role.

Umysł dziecka poznającego scenografię, w której przyjdzie mu kiedyś walczyć o swój los, pełen jest zachwytu i otwartości. Poczucie wstydu przed zadaniem niby zbyt naiwnego pytania jest mu obce. Wszak każda nowa informacja może uczynić przyszłe zmagania lżejszymi. Toteż umysł dziecka pytań zadaje co niemiara, równocześnie będąc uważnym obserwatorem swojego otoczenia.

Z czasem jednak uwaga ta zatraca się. Rytm dnia zarzyna narzucać jedynie podstawowy takt dla naszych działań. Cykliczność pór roku nabiera wymiaru praktycznego, sprowadzając się do tak prozaicznych czynności jak zmiana przyodziewku. Oswojenie się z faktem przemijalności życia narzuca zaś ramy czasowe dla naszej aktywności i wymusza przyjęcie różnych strategii radzenia sobie z tymi, niekoniecznie pożądanymi okolicznościami. O ile od czasu do czasu jakiś silny impuls potrafi ponownie wyrwać umysł ze sfery jego codziennej aktywności, o tyle są to zazwyczaj już jedynie epizody, zakończone szybkim powrotem do pewnego stanu ustalonego.

Jednym z najważniejszych pytań, jakie pojawia się w umyśle dziecka, jest to dotyczące przyczyny istnienia jego i świata, który je otacza. Nie dzieje się to jednak tak szybko. Umysł dziecka stopniowo rozszerza sferę swojej percepcji otoczenia. Jego cały świat to początkowo łóżeczko, w którym sypia. Z dnia na dzień poznaje pokój, a następnie – dom i podwórko. Poznawane jest kolejno miasto, a odleglejsze wyjazdy kształtują pojęcie kraju. Zabawa z globusem stopniowo przyzwyczaja do myślenia o świecie jako kuli, na powierzchni której żyjemy. Odpowiedzi na pytania dotyczące dwóch najbardziej wyraźnych obiektów na naszym niebie: słońca i księżyca pozwalają rozszerzyć percepcję dziecka o kolejny krok. Spektakularne zdjęcia galaktyk wzbudzają ciekawość do jeszcze potężniejszych skal. W małej główce dziecka zaczynają się kłębić myśli o czymś tak ogromnym, że nie jest w stanie nawet tego zobaczyć, a czego częścią przecież samo jest.

Pytanie dotyczące istnienia bierze swoje źródło również w innej obserwacji. Rzeczy z pozoru mogą istnieć, ale również nie istnieć. To samo dotyczy zdarzeń, które zachodzą lub też nie zachodzą. W pudełku dziecko znajduje cukierek lub też tego cukierka tam nie ma. Ludzie rodzą się i umierają. Słońce świeci w dzień i znika w nocy. A noc to ciemność.

Każdy, kto pamięta zabawę w chowanego lub też obserwował bawiące się w chowanego dzieci, mógł zauważyć bardzo charakterystyczne zachowanie. Mianowicie, małym dzieciom do schowania się wystarczy zasłonięcie oczu. Nie potrzebują znaleźć fizycznej kryjówki. W ich kształtującej się jeszcze świadomości doświadczenie ciemności w następstwie zasłonięcia oczu tożsame jest z brakiem ich obecności. Wydaje im się więc, że tym samym nie istnieją dla otoczenia i nie są widoczne dla współtowarzyszy zabawy.

Ciemność jest w umyśle dziecka tożsama z brakiem istnienia. I tak właśnie, jak dobrze pamiętam, wyobrażałem sobie nicość, będąc chłopcem.

black
Dziecięce wyobrażenie nieistnienia.

Dochodzimy tutaj do kluczowej kwestii. Otóż umysł dziecka w sposób, wydaje się, naturalny dochodzi do koncepcji przejścia pomiędzy nicością a istnieniem, która towarzyszy mu do życia dorosłego. Próba zrozumienia tego zagadnienia stała się źródłem wielu koncepcji metafizycznych, kształtujących świat, w którym żyjemy. Rozważania te przyczyniły się również do rozwoju myśli naukowej, będąc źródłem zarówno idei filozoficznych, jak i inspiracją do badań w obszarze nauk przyrodniczych. Wydaje się, że to właśnie chęć wniknięcia w głębię tego zagadnienia kierowała moimi decyzjami związanymi z podjęciem studiów i później pracą naukową w obszarze fizyki teoretycznej oraz kosmologii.

Trzeba tu podkreślić fakt, że jako ludzie mamy – chociaż bardzo rozwinięte, to jednak ograniczone – możliwości poznawcze. Staramy się zrozumieć przyrodę, wykorzystując pojęcia, które są przyswajalne dla naszej umysłowości. Wynikają one z naszego doświadczenia i ukształtowane zostały w okresie dorastania. W oparciu o nie budowany jest nasz obraz rzeczywistości. Trzeba sobie jednak zdawać sprawę z ich ograniczeń. Próba zrozumienia fundamentalnych warstw rzeczywistości wymaga niejako wyjścia poza granicę możliwości percepcji człowieka i posługiwania się nowymi, nieznanymi z życia codziennego pojęciami. Narzędzi, będących wytworem myśli ludzkiej, umożliwiających wykonanie kroku w przód dostarczają nam matematyka i fizyka.

Przywołane pojęcie „nieistnienia” jest zaś fizyce obce. W świecie fizycznym różne formy materii i energii mogą podlegać przeobrażeniom – tak zwanym procesom. Kiedy umieramy, atomy, z których jesteśmy złożeni, nie znikają. Przyjmują natomiast inną formę organizacji. Ponadto w trakcie naszego życia atomy te podlegają ciągłej wymianie. Jesteśmy więc procesami – nie zaś ustalonymi bytami. Nie zaobserwowano, by kiedykolwiek coś fundamentalnie przepadło, czyli przestało istnieć. Żaden eksperyment nie wykazał również, że cokolwiek pojawiło się w naszym rzeczywistym świecie znikąd, czyli że (z naszej perspektywy) wcześniej nie istniało. Mamy więc dowód na to, że różne formy energii i materii mogą istnieć. Obserwujemy je. Nie dysponujemy natomiast jakąkolwiek ewidencją tego, że cokolwiek może „nie istnieć”.

Czy więc naturalnym stanem rzeczy i w konsekwencji naszego świata, który się z tych rzeczy składa, jest po prostu istnienie? Chodź wciąż można czuć tutaj pewien dyskomfort – bo przecież, jak to wszystko po prostu istnieje? Nie musiało się skądś wziąć? Jednakże – rozumiejąc zarówno głębię świata fizycznego, jak i będąc świadomym granic naszych zdolności poznawczych – nie jest to dla mnie koncepcja na tyle abstrakcyjna, by nie móc jej zaakceptować. Jest, uważam, racjonalna. To znaczy, przy obecnym stanie wiedzy, jest to punk widzenia ze znanych mi najbardziej minimalistyczny. Nie wymagający odnoszenia się do koncepcji dalekich od weryfikowalnych.

Skoro więc pojecie „nieistnienia” nie ma fundamentalnego charakteru i nikt nigdy nie zaobserwował czegoś, co wcześniej nie istniało, w jakim celu posługiwać się takim pojęciem? Z pewnością jest ono wciąż przydatne w codziennej wymianie informacji, gdzie znaczenie tego słowa jest jasne i nie istnieje ryzyko nadużycia. W rozważaniach dotyczących spraw podstawowych należy się jednak wykazać dużą ostrożnością, gdyż istnieje uzasadnione ryzyko ekstrapolacji tego pojęcia poza obszar jego stosowalności – co niestety wciąż ma miejsce. Co więcej, jestem zdania, że posługiwanie się pojęciem „nieistnienia” w kontekście Wszechświata wprowadziło wiele, posługując się eufemizmem, nieporozumień. 

Czym więc zatem jest stan „istnienia”? Jest to rzeczywistość, którą uparcie staramy się zrozumieć. Wiemy jednak, że na przykład fizyka mikroświata (mechanika kwantowa) dopuszcza różne interpretacje tego, co możemy nazwać obiektywną rzeczywistością. Szczegółowe omówienie tego zagadnienia wychodzi jednak poza ramy tego eseju. W skali makroskopowej za roboczą definicję naszego istnienia możemy zaś przyjąć chociażby fakt czytania tego zdania.

Rekapitulując, to, że rzeczy istnieją, jest faktem empirycznym. Obserwujemy ich obecność zarówno bezpośrednio, za pomocą posiadanych przez nas zmysłów, jak również pośrednio, wykorzystując różnorakie urządzenia pomiarowe. Energia i materia mogą ulegać przekształceniom, ale nie giną i nie pojawiają się znikąd. Pojawienie się czegoś z niczego nie zostało nigdy zaobserwowane. Daje nam to podstawy do stwierdzenia, że: nieistnienie nie istnieje. Samo pojęcie „nieistnienia” pomimo swojej ograniczonej stosowalności wciąż może być z powodzeniem stosowane w wielu sytuacjach życia codziennego. Rozumiejąc to, nie pozostaje nam nic innego niż zaakceptować fakt istnienia Wszechświata.

© Jakub Mielczarek

“…Nothingness does not exist
No thing has ever become nothing
And nothing has never become something
What is has always been and will always be”

John Frusciante, After the Ending

Kwantowe cienie

Rzucany przez przedmiot cień nie zawsze daje nam właściwe wyobrażenie o naturze oświetlanego obiektu. Dowodzi tego chociażby twórczość duetu artystycznego Tim Noble i Sue Webster, której przykład pozwoliłem sobie zamieścić poniżej.

Real Life Is Rubbish
Tim Noble i Sue Webster Real Life Is Rubbish (2002). Źródło

Przyjrzymy się powyższemu zdjęciu trochę bliżej. Widzimy na nim stertę śmieci które, pod określonym kątem, rzucają cień dwojga ludzi – Twórców instalacji. Jednym z zamysłów Artystów było niewątpliwie to by wprowadzić nasz mózg w zakłopotanie, poprzez dwoistość interpretacji tego co widzimy. Co mianowicie jest pierwotne, czy są to sylwetki ludzi czy też oświetlane przedmioty? Oczywiście, z punktu widzenia fizyki , sprawa jest prosta, pierwotna jest sterta rupieci, natomiast cień jest wtórny, a ponadto nie jest on obiektem fizycznym. Wchodząc na warstwę czysto artystyczną, Twórcy skłaniają nas więc do interpretowania prawdziwego (fizycznego) życia jako nie wartego więcej niż to co zdołaliśmy wyrzucić. Świat alegorii nie rządzi się jednak prawami fizyki, przez co nieskrępowanie moglibyśmy kontynuować dalej nasze wywody na temat interpretacji i znaczeń. Jest to niewątpliwe zarówno przyjemne ćwiczenie naszej kreatywności oraz intelektualne wyzwanie. Chciałbym jednak żebyśmy, po tej małej rozgrzewce, wykorzystali nasze umysły do zastanowienia się nad tym czy skoro nie jeden cień to może większa ich ilość może nam pozwolić odsłonić naturę obiektu  który te cienie rzuca. Wyobraźmy sobie na przykład, że instalację Real Life Is Rubbish zaczynamy oświetlać pod innymi kątami. Otrzymane cienie nie będą miały już nic wspólnego z sylwetkami ludzi, mogą nie przypominać zupełnie niczego.  Czy istnieje jednak metoda na to by wykorzystując te dwuwymiarowe rzuty zrekonstruować trójwymiarowy kształt sterty śmieci? Okazuje się, że jest to możliwe, chociaż w przypadku nietransparentnych obiektów taka procedura ma swoje istotne ograniczenia. Transparentność przedmiotów zależy jednak w dużym stopniu od długości fali którymi je oświetlimy. Jeśli zamiast światła widzialnego użylibyśmy rentgenowskiego zakresu promieniowania elektromagnetycznego, na podstawie rzucanych przez przedmiot cienieni moglibyśmy zrekonstruować jego trójwymiarowy kształt. Metoda ta nazywa się tomografią i jest powszechnie stosowana w obrazowaniu medycznym.  Bodajże najpopularniejszym jej przykładem jest tomografia komputerowa (CT), pozwalająca dzięki obrazom (cieniom) rentgenowskim, otrzymanym pod różnym kątem, stworzyć trójwymiarowy obraz, na przykład mózgu (film poniżej).

Od strony matematycznej, zasada działania tomografii opiera się na tak zwanej transformacie Radona. Jest to operacja  która na podstawie dwuwymiarowych projekcji (cieni) pozwala odzyskać trójwymiarowy rozkład gęstości obiektu.

Podobną do tomografii komputerowej procedurę rekonstrukcji trójwymiarowego obrazu możemy przeprowadzić również w mikroskali – w świecie kwantowym. Nosi ona nazwę tomografii kwantowej.  Odpowiednikiem rozkładu gęstości jest tu tak zwana funkcja Wignera, którą otrzymujemy ze stanu  kwantowego | \Psi \rangle, lub ogólniej tak zwanej macierzy gęstości, która w przypadku stanów czystych (ang. pure states) może być wyrażona w następujący sposób: \hat{\rho} = | \Psi \rangle \langle \Psi |.  Na przykład, dla cząstki w jednym wymiarze funkcję Wignera W(x,p), gdzie x to położenie a p to pęd możemy zapisać jako

W(x,p) = \frac{1}{\pi \hslash} \int_{-\infty}^{+\infty} \langle x+y | \hat{\rho} | x-y \rangle e^{-2i py/\hslash} dy.

Z uwagi na ścisłą relację pomiędzy funkcją Wignera a macierzą gęstości, poprzez tomografię kwantową rozumiemy zrekonstruowanie, poprzez dokonanie odpowiednich pomiarów “kwantowych cieni” stanu układu kwantowego, jednego z tych dwóch obiektów.  Chciałbym Ci teraz drogi Czytelniku pokazać jak to wygląd w praktyce i w jaki sposób tomografię stanu kwantowego będziesz mogła lub mógł przeprowadzić samodzielnie, nie odchodząc nawet od komputera.  Choć świat kwantowy może Ci się jawić jako zupełnie niedostępny a wykonywanie w nim pomiarów jako coś mało realnego, dzięki rozwojowi technologii kwantowych możemy się dzisiaj do niego całkiem łatwo dostać.  Wszystko za sprawą dostępnego publicznie pięciokubitowego komputera kwantowego firmy IBM, do którego możesz uzyskać dostęp poprzez tę stronę internetową. Jako wstęp do zagadnienia komputerów kwantowych zachęcam Cię do zapoznania się z moim wcześniejszym wpisem Elementary quantum computing.  Zakładając, że jesteś uzbrojona/ny w podstawowe wiadomości dotyczące mechaniki kwantowej, chciałbym przejść do pokazania Ci jak przeprowadzić tomografię stanu kwantowego pojedynczego kubitu, czyli stanu

|\Psi \rangle = \alpha|0\rangle +\beta |1\rangle,

gdzie, \alpha, \beta \in \mathbb{C} (liczby zespolone), a warunek normalizacji stanu kwantowego \langle \Psi | \Psi \rangle = 1 implikuje, że |\alpha|^2+|\beta|^2=1. Kubit jest nośnikiem najmniejszej porcji informacji kwantowej (odpowiednik klasycznego bitu) i od strony matematycznej jest elementem dwuwymiarowej przestrzeni wektorowej nad ciałem liczb zespolonych, czyli tak zwanej przestrzeni Hilberta.

Zanim przejdziemy do przeprowadzenia pomiarów na kubicie wykorzystując komputer kwantowy IBM Q, wprowadźmy najpierw niezbędne podstawy teoretyczne. Po pierwsze, będziemy chcieli zrekonstruować macierz gęstości \hat{\rho}, która w przypadku kubitu jest macierzą 2\times2 i można ją wyrazić jako:

\hat{\rho} = \frac{1}{2} \left( \hat{\mathbb{I}}+ \langle \hat{X}\rangle \hat{X}+ \langle \hat{Y}\rangle \hat{Y}+ \langle \hat{Z}\rangle \hat{Z}    \right) = \frac{1}{2}\left( \hat{\mathbb{I}}+\vec{S}\cdot \vec{\sigma}  \right) =\frac{1}{2} \left( \begin{array}{cc} 1+\langle \hat{Z}\rangle & \langle \hat{X}\rangle-i\langle \hat{Y}\rangle \\ \langle \hat{X}\rangle+i\langle \hat{Y}\rangle   & 1-\langle \hat{Z}\rangle \end{array} \right) .

Powyżej, wprowadziłem operatory \hat{X}, \hat{Y}, \hat{Z}, którym w reprezentacji macierzowej odpowiadają tak zwane macierze Pauliego:

\hat{X} := \sigma_x = \left( \begin{array}{cc} 0 & 1  \\ 1  & 0 \end{array} \right),  \ \  \hat{Y} := \sigma_y = \left( \begin{array}{cc} 0 & -i  \\ i  & 0 \end{array} \right),  \ \ \hat{Z} := \sigma_z = \left( \begin{array}{cc} 1 & 0  \\ 0  & -1 \end{array} \right) ,

składające się na wektor \vec{\sigma} = (\sigma_x,\sigma_y,\sigma_z).  Natomiast,  wektor \vec{S} = (\langle \hat{X}\rangle,\langle \hat{Y}\rangle,\langle \hat{Z}\rangle) złożony jest z wartości średnich które można obliczyć w oparciu o ogólne wyrażenie: \langle \hat{A}\rangle := \text{tr} (\hat{\rho} \hat{A}).

Po drugie, warto w tym momencie wprowadzić użyteczne pojęcie sfery Blocha. Mianowicie, jest to sfera jednostkowa która reprezentuje wszystkie możliwe stany kwantowe kubitu. Każdy punkt na tej sferze to inny stan kwantowy i wskazuje na niego wprowadzony powyżej wektor \vec{S}. Równanie sfery Blocha to więc \vec{S}\cdot \vec{S} = \langle \hat{X}\rangle^2+\langle\hat{Y}\rangle^2+\langle \hat{Z}\rangle^2=1. Warto zaznaczyć, że powyższe równanie sfery jest konsekwencją tego, iż \hat{\rho}=\hat{\rho}^2, co wynika z założenia dotyczącego czystości stanu kwantowego.

Bloch

Sferę Blocha wygodnie sparametryzować poprzez poprzez kąty \phi \in [0, 2 \pi) oraz \theta \in [0, \pi] tak, że stan kwantowy kubitu możemy z ich pomocą zapisać jako

| \Psi \rangle = \cos(\theta/2) |0 \rangle + e^{i \phi} \sin (\theta/2)| 1 \rangle,

gdzie pominięty został nieistotny globalny czynnik fazowy. Tomografia stanu kwantowego kubitu równoważna jest ze znalezieniem składowych wektora \vec{S},  wskazującego na konkretny punk na sferze Blocha. Wektor ten jest obiektem który chcemy zrekonstruować, podobnie jak rozważany wcześniej oświetlany przedmiot. Korzystając z tej analogii, możemy obrazowo powiedzieć, że wektor Blocha \vec{S} “rzuca trzy cienie” będące jego składowymi (rzutami).  Tomografia stanu kwantowego wymaga określenia tych trzech składowych. Jednakże, w przypadku stanów czystych, długość wektora  \vec{S} jest równa jeden (spełnione jest równanie sfery \vec{S}\cdot \vec{S} = \langle \hat{X}\rangle^2+\langle\hat{Y}\rangle^2+\langle \hat{Z}\rangle^2=1) co wprowadza relację pomiędzy “cieniami”. W takim przypadku, wystarczy zmierzyć jedynie dwie spośród wszystkich trzech składowych. Trzeci rzut możemy zaś wyznaczyć z równania sfery Blocha.  Z uwagi na to, że w przypadku ogólnym, stan kwantowy poprzez jego oddziaływanie ze środowiskiem może nie być do końca czysty (staje się tak zwanym stanem mieszanym) zasadne jest by z góry nie dokonywać założenia o czystości stanu kwantowego.

Komputer kwantowy IBM, pracujący w oparciu  o tak zwane kubity nadprzewodzące, pozwala nam wykonać pomiary w bazie własnej operatora \hat{Z}.  Wielokrotne powtórzenie pomiarów w takiej bazie, dla każdorazowo przygotowanego na nowo takiego samego stanu kwantowego, pozwala wyznaczyć wartość średnią operatora \hat{Z} w tym stanie. Mianowicie, ponieważ \hat{Z}|0\rangle = |0\rangle oraz  \hat{Z} |1\rangle = -|1\rangle, otrzymujemy

\langle \hat{Z} \rangle = (\alpha^* \langle 0| +\beta^* \langle 1|)(\alpha|0\rangle -\beta |1\rangle) = |\alpha|^2-|\beta|^2 = P(0)-P(1),

gdzie wykorzystaliśmy ortonormalność stanów bazowych |0\rangle i |1\rangle. Poszukiwana średnia jest więc różnicą pomiędzy prawdopodobieństwami znalezienia układu w stanie |0\rangle a w stanie  |1\rangle. Wyznaczenie średnich \langle \hat{X} \rangle  oraz \langle \hat{Y} \rangle, niezbędnych do przeprowadzenia tomografii, nie jest już takie bezpośrednie. Należy mianowicie dokonać pomiarów w bazach własnych operatorów \hat{X}   oraz \hat{Y}. Jak pokażemy poniżej, można tego dokonać dokonując odpowiednich transformacji badanego stanu kwantowego.  Do tego celu będą nam pomocne dodatkowe operatory:

\hat{H} = \frac{1}{\sqrt{2}} \left( \begin{array}{cc} 1 & 1  \\ 1  & -1 \end{array} \right), \ \ \  \hat{S} = \left( \begin{array}{cc} 1 & 0  \\ 0  & i \end{array} \right), \ \ \  \hat{S}^{\dagger} = \left( \begin{array}{cc} 1 & 0  \\ 0  & -i \end{array} \right) ,

pierwszy z nich to tak zwany operator Hadamarda, stowarzyszona z nim tak zwana bramka Hadamarda jest ważnym elementem w konstrukcji obwodów kwantowych. Operator \hat{S} to natomiast operator obrotu fazy o 90 stopni, natomiast \hat{S}^{\dagger} to jego sprzężenie hermitowskie.

Ponieważ jesteśmy już blisko momentu w którym zaczniemy dokonywać konkretnych pomiarów, zdecydujmy się na wybór stanu kwantowego który będziemy chcieli poddać tomografii. Mój wybór padł na stan:

| \Psi \rangle = \hat{T} \hat{H} | 0 \rangle = \frac{1}{\sqrt{2}} \left( | 0 \rangle + e^{i \frac{\pi}{4}} | 1 \rangle  \right),

dla którego wektor Blocha wskazuje, pod kątem \phi = 45^{\circ}, na punkt na  równiku na sferze Blocha. Natomiast, Ciebie drogi Czytelniku, po przeanalizowaniu poniższego przykładu,  zachęcam do eksperymentowania z wybranymi przez Ciebie stanami kwantowymi. Dodam jeszcze, że powyżej wykorzystałem operator \hat{T} zdefiniowany jest w następujący sposób:

\hat{T} := \sqrt{\hat{S}}=\left( \begin{array}{cc} 1 & 0  \\ 0  & e^{i \frac{\pi}{4}} \end{array} \right).

Dla wybranego przeze mnie stanu kwantowego, macierz gęstości przybiera postać:

\hat{\rho}_1 = \frac{1}{2} \left( \begin{array}{cc} 1 & \frac{1}{\sqrt{2}}-\frac{i}{\sqrt{2}}  \\  \frac{1}{\sqrt{2}}+ \frac{i}{\sqrt{2}}   & 1 \end{array} \right) .

Sprawdzenie tego pozostawiam jako zadanie dla Ciebie. Porównują elementy tej macierzy z wprowadzoną na wstępie ogólną postacią macierzy gęstości dla kubitu możemy odczytać, że wartości operatorów \hat{X}, \hat{Y}, \hat{Y} mają w tym stanie następujące wartości:

\langle \hat{X} \rangle = \frac{1}{\sqrt{2}},  \ \ \langle \hat{Y} \rangle = \frac{1}{\sqrt{2}}, \ \  \langle \hat{Z} \rangle = 0.

Przekonajmy się teraz na ile te przewidywania teoretyczne zgadzają się z pomiarami otrzymanymi w komputerze kwantowym charakteryzującym się błędami zarówno bramek kwantowych oraz odczytu jaki i wynikającymi z tak zwanej dekoherencji kwantowej, wprowadzającej mieszanie stanu kwantowego.

Pomiar \langle \hat{Z} \rangle

Poniżej, przedstawiono obwód kwantowy umożliwiający wytworzenie stanu | \Psi \rangle = \hat{T} \hat{H} | 0 \rangle = \frac{1}{\sqrt{2}} \left( | 0 \rangle + e^{i \frac{\pi}{4}} | 1 \rangle  \right), oraz wykonanie na nim pomiarów w bazie \{|0\rangle, |1 \rangle \}. Obwód taki możemy łatwo zbudować korzystając z kreatora dostępnego na stronie IBM Experience.

Tom-ZPowtarzając powyższy algorytm 1024 razy otrzymaliśmy  P(0)=0.567 oraz  P(1)=0.433, co pozwala wyznaczyć \langle \hat{Z} \rangle = P(0)-P(1)=0.134. Niepewność tego wyniku ma dwa źródła. Pierwsze jest związane z błędami instrumentalnymi pochodzącymi od błędów bramek, będącymi na poziomie 0.001 na bramkę jedno-kubitową, oraz błędami odczytu, który jest na poziomie 0.08. Drugie źródło niepewności jest związane ze statystyczną naturą mechaniki kwantowej. W  rozważanej sytuacji spodziewamy się, że z jednakowym prawdopodobieństwem będziemy otrzymywać jako wynik pomiaru stany |0\rangle oraz  |1\rangle. Zagadnienie oszacowania odpowiednich niepewności jest matematycznie równoważne do przypadku błądzenia przypadkowego w jednym wymiarze. Jeśli przez N_0 oznaczymy ilość wyników  |0\rangle a przez N_1 ilość wyników dla |1\rangle, tak, że N_0+N_1=N=1024, to odchylenie standardowe N_0 i N_1 wyniesie s=\sqrt{N/4}=16. Stąd, możemy wyznaczyć niepewność estymacji prawdopodobieństwa, wynikającą ze statystycznej natury mechaniki kwantowej na s/N = 1/\sqrt{4N} \approx 0.016. Sumaryczną niepewność pomiaru możemy więc określić na około 0.1, czyli około 10 \%.  Otrzymane wyniki, dla P(0) oraz P(1), są w granicach tej niepewności zgodne z teoretycznie przewidywanymi  wartościami.

Pomiar \langle \hat{X} \rangle

Wykonanie pomiaru wartości średniej \langle \hat{X} \rangle wymaga obrócenia układu tak żeby ustawić kierunek X wzdłuż osi Z. Można tego dokonać dzięki poniższej relacji operatorowej

\hat{X} = \hat{H} \hat{Z} \hat{H},

którą łatwo dowieść wykorzystując reprezentację macierzową zaangażowanych tu operatorów. Na tej podstawie, wartość średnią operatora \hat{X} w  stanie  |\Psi \rangle możemy wyrazić jako

\langle \hat{X} \rangle = \langle \Psi | \hat{X} |\Psi \rangle = (\langle \Psi | \hat{H}) \hat{Z} (\hat{H}|\Psi \rangle) .

Żeby więc obliczyć wartość  \langle \hat{X} \rangle należy na stan  |\Psi \rangle zadziałać operatorem \hat{H}, po czym wystarczy dokonać pomiarów w bazie operatora \hat{Z}. Ilustruje to poniższy obwód kwantowy:

Tom-XWykonując 1024 pomiary, zupełnie tak samo jak w przypadku \langle \hat{Z} \rangle, otrzymujemy  P(0)=0.870, P(1)=0.130, co pozwala nam wyznaczyć \langle \hat{X} \rangle = P(0)-P(1)=0.740. Rozważania dotyczące niepewności pomiaru są analogiczne jak w przypadku wyznaczania  \langle \hat{Z} \rangle.

Pomiar \langle \hat{Y} \rangle

Podobnie jak w przypadku pomiaru \langle \hat{X} \rangle, również wyznaczenie wartości średniej operatora \hat{Y} może zostać wykonana poprzez odpowiednią transformację stanu kwantowego. W tym przypadku, należy wykorzystać transformację:

\hat{Y} = (\hat{S} \hat{H}) \hat{Z}(\hat{S} \hat{H})^{\dagger} = (\hat{S} \hat{H}) \hat{Z}(\hat{H} \hat{S}^{\dagger}),

(udowodnij tę relację) na której podstawie:

\langle \hat{Y} \rangle = \langle \Psi | \hat{Y} |\Psi \rangle = (\langle \Psi | \hat{S} \hat{H}) \hat{Z} (\hat{H} \hat{S}^{\dagger}|\Psi \rangle).

W celu wyznaczenia wartość średniej \langle \hat{Y} \rangle musimy więc na otrzymany stan zadziałań najpierw operatorem \hat{S}^{\dagger}, następnie operatorem \hat{H}, po czym dokonać pomiarów w bazie operatora \hat{Z}, jak to przedstawiono na obwodzie poniżej:

Tom-Y

Stąd, postępując analogicznie jak w poprzednich przypadkach, otrzymujemy P(0)=0.837, P(1)=0.163, a to pozwala nam wyznaczyć  \langle \hat{Y} \rangle = P(0)-P(1)=0.674. Czym kończymy nasze pomiary. Pozostaje nam pozbierać otrzymane wyniki.

Zbierając wszystko razem  

Zbierając powyższe wyniki, otrzymujemy następujący wektor Blocha:

\vec{S} = (\langle \hat{X}\rangle,\langle \hat{Y}\rangle,\langle \hat{Z}\rangle) =  (0.740,0.674,0.134),

którego kwadrat modułu \vec{S}\cdot \vec{S} \approx 1.02 co jest, w granicach błędu, zgodne z przypadkiem stanu czystego. Natomiast, otrzymana w wyniku przeprowadzonej tomografii macierz gęstości to

\hat{\rho}_2 = \frac{1}{2} \left(\begin{array}{cc} 1.134  & 0.740-i 0.674 \\ 0.740+i 0.674  & 0.866 \end{array} \right) .

Powszechnie stosowaną metodą ilościowego określenia zgodności dokonanej tomografii z wartością teoretyczną jest wyznaczenie tak zwanej wierności (ang. fidelity) zdefiniowanej w następujący sposób:

F(\hat{\rho}_1,\hat{\rho}_2):= \text{tr}\sqrt{\sqrt{\hat{\rho}_1}\hat{\rho}_2 \sqrt{\hat{\rho}_1}} .

Stosując powyższe wyrażenia do teoretycznie przewidzianej macierzy gęstości \rho_1 oraz macierzy gęstości otrzymanej w wyniku procedury tomografii \rho_2, otrzymujemy wartość F(\hat{\rho}_1,\hat{\rho}_2) \approx 99.996 \%. Wierność zrekonstruowanego kwantowego tomogramu jest więc bardzo wysoka, co jest jednak zgodne z oczekiwaniami dla pojedynczego kubitu. W przypadku tomografii przeprowadzonej dla większej ilości kubitów, wierność odwzorowania będzie odpowiednio niższa. O ile niższa? To już zależy od konkretnego stanu kwantowego. Jeśli masz ochotę na dalsze ambitniejsze wyzwanie, zachęcam Cię do przeprowadzenia tomografii jednego ze splątanych stanów Bella. Stany te odgrywają dużą rolę zarówno w obliczeniach kwantowych jak i w teleportacji kwantowej oraz kwantowej kryptografii (np. protokół Ekerta). W zastosowaniach tych, przygotowanie stanu kwantowego o odpowiednio wysokiej wierności ma znaczenie praktyczne i uzależnione jest od tego na przykład bezpieczeństwo zaszyfrowanej kwantowo informacji. Przyglądając się uważnie “kwantowym cieniom” stanu Bella możemy zdiagnozować czy jest on wystarczajaco “zdrowy” do wykonania powierzonego mu zadania.

© Jakub Mielczarek

Elementary quantum computing

For theoretical physicists, programming quantum computers sounds like one of the easiest things to do. It is just playing with tensor products of two-dimensional Hilbert spaces and constructing certain unitary operators. However, we are not such common species and some other people would also like to learn a bit more about quantum computing as well.  Therefore, here I will show what the basics of quantum computing are.  My approach is to present a very simple example of how to construct a quantum circuit and execute it on a real quantum computer. Namely, we will use publicly available IMB Q Experience  platform to generate one of the so-called Bell states:

| B \rangle = \frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right).

This state has quite interesting physical interpretation. It represents maximally entangled state of two spin 1/2 particles (e.g. two electrons) such that the total spin of the system is equal zero (such states are known as singlets). The | B \rangle state is relevant in both quantum computing and quantum cryptography. So, let us begin…

howtomeasure
Picture of the IBM quantum chip composed of 7 superconducting qubits. Source

A single qubit is a state (vector) | \Psi \rangle  in two-dimensional Hilbert space, which we denote as \mathcal{H}. Let us choose the space to be spanned by two orthonormal basis states |0\rangle and |1\rangle such that \langle 1|0\rangle =0 and \langle 0|0\rangle = 1 = \langle 1|1\rangle . A general qubit is a superposition of the basis states:

| \Psi \rangle = \alpha|0\rangle +\beta |1\rangle ,

where, \alpha, \beta \in \mathbb{C} (complex numbers), and the normalization condition \langle \Psi | \Psi \rangle = 1 implies that |\alpha|^2+|\beta|^2=1.

There are different quantum operators (gates) which may act on the quantum state | \Psi \rangle. For instance, the so-called bit-flip operator \hat{X} which  transforms  |0\rangle into  |1\rangle and  |1\rangle into  |0\rangle  (\hat{X}|0\rangle =|1\rangle and \hat{X}|1\rangle =|0\rangle) can be introduced. Another important operator is the Hadamard operator \hat{H} which is defined by the following action on the qubit basis states:

\hat{H}|0\rangle =\frac{1}{\sqrt{2}}\left(|0\rangle  +|1\rangle\right)  and  \hat{H}|1\rangle =\frac{1}{\sqrt{2}}\left(|0\rangle  -|1\rangle\right).

The above are examples of operators acting on a single qubit. However, while considering quantum computing we usually deal with quantum register composed of N qubits.  The resulting quantum state belongs to Hilbert space being a tensor product of N copies of the qubit Hilbert space:

\underbrace{\mathcal{H}\otimes\mathcal{H}\otimes \dots \otimes\mathcal{H}}_{N},

dimension of which is

\text{dim}(\underbrace{\mathcal{H}\otimes\mathcal{H}\otimes \dots \otimes\mathcal{H}}_{N})=2^N.

This exponential growth with N is the main obstacle behind simulating quantum systems on classical computers. With the present most powerful classical supercomputers we can simulate quantum systems with {\bf N=56} at most. The difficulty is due to the fact that quantum operators acting on 2^N dimensional Hilbert space are represented by 2^N\times2^N matrices, which are very difficult to deal with when N is roughly more than 50 (for N=56, 2^{56} \sim 10^{17}).  

A quantum algorithm is simply a unitary operator \hat{U} acting on the initial state of N quibits |0\rangle\otimes|0\rangle \otimes \dots \otimes|0\rangle \in\mathcal{H}\otimes\mathcal{H}\otimes \dots \otimes\mathcal{H}. The outcome of the quantum algorithm is obtained by performing measurements on the final sate: \hat{U}(|0\rangle\otimes|0\rangle \otimes \dots \otimes|0\rangle). Because of the probabilistic nature of quantum mechanics, the procedure has to be performed repeatedly in order to reconstruct the final state.

The unitary operator \hat{U} can be decomposed into elementary operators called quantum gates, similarly to the logical electronic circuits which are built out of elementary logic gates.  The already introduced \hat{X} and \hat{H} operators are examples of gates acting on a single qubit. However, the gates may also act on two or more qubits. An example of 2-qubit gate relevant for our purpose is the so-called CNOT gate, which we denote as \hat{C}.  The operator is acting on 2-qubit state |ab\rangle \equiv |a\rangle \otimes|b\rangle, where |a\rangle and |b \rangle are single quibit states. Action of the CNOT operator on the basis states can be expressed as follows:

\hat{C}(|a\rangle \otimes|b\rangle) =|a\rangle \otimes|a\oplus b\rangle,

where a,b \in \{0,1\}.  The \oplus is the XOR (exclusive or) logical operation (or equivalently addition modulo 2), defined as 0\oplus 0 = 0,  0\oplus 1 = 11\oplus 0 = 1 and 1\oplus 1 = 0. In consequence:

\hat{C}|00\rangle =|00\rangle,   \hat{C}|01\rangle =|01\rangle,   \hat{C}|10\rangle =|11\rangle,   \hat{C}|11\rangle =|10\rangle.

We are now equipped to address the initial task of creating the Bell state  | B \rangle = \frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right). We will perform it in the following steps:

  1. We begin with the initial 2-qubit state  |00\rangle \equiv |0\rangle\otimes|0\rangle.
  2.  Then, we are acting on both qubits with the spin-flip operator \hat{X}. The corresponding operator has a form of the following tensor product: \hat{X}\otimes \hat{X} . Action of this operator on the initial state gives:  (\hat{X}\otimes \hat{X})(|0\rangle\otimes|0\rangle ) =(\hat{X}|0\rangle\otimes\hat{X}|0\rangle)=|1\rangle\otimes|1\rangle \equiv |11\rangle.
  3. Now, let us act on the first quibit with the Hadamard operator (gate), leaving the second qubit unchanged. Such operation is represented by the operator \hat{H}\otimes\hat{I}, where \hat{I} is the identity operator which does not change a quantum state. Action of \hat{H}\otimes\hat{I} on |11\rangle gives \frac{1}{\sqrt{2}}(|0\rangle  -|1\rangle)\otimes |1 \rangle = \frac{1}{\sqrt{2}}|01\rangle-\frac{1}{\sqrt{2}}|11\rangle .
  4. In the final step we are acting on the obtained state with the CNOT gate: \hat{C}(\frac{1}{\sqrt{2}}|01\rangle-\frac{1}{\sqrt{2}}|11\rangle )=\frac{1}{\sqrt{2}}\hat{C}|01\rangle-\frac{1}{\sqrt{2}}\hat{C}|11\rangle =\frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right), getting the Bell state.

The total unitary operator representing our quantum algorithm can be written as a composition of the elementary steps:

\hat{U} =\hat{C}(\hat{H} \otimes \hat{I} )(\hat{X} \otimes \hat{X}).

Action of this operator on the initial state |00\rangle gives the state | B \rangle:

\hat{U}|00\rangle =\frac{1}{\sqrt{2}} \left(|01\rangle -|10\rangle  \right).

In the experimental part we will create the Bell state employing publicly accessible 5-qubit quantum computer provided by IBM. In the quantum device, qubits are constructed using superconducting circuits, operating at millikelvin temperatures. Access to the device can be obtained through this link (you have to create a free account and login).

IBMQ5

The quantum circuit representing the operator \hat{U} can  now be created using the quantum gates in the online quantum composer. The quantum circuit should look as follows (we used the last two qubits here):

Algorithm

The green boxes with letter X represent the bit-flip gates, the blue box with letter H represents the Hadamard gate, while the next operation from the left is the CNOT gate acting on both qubits. Finally, the pink boxes represent measurements performed on the final state. Restricting to the last two qubits,  the final state can be expressed as the following superposition:

|\Psi \rangle =c_1|00\rangle+c_2|01\rangle+c_3|10\rangle+c_4|11\rangle,

where c_1, c_2, c_3, c_4 \in \mathbb{C} and |c_1|^2+| c_2|^2+|c_3|^2+ |c_4|^2=1. What is measured are probabilities of the basis states P(i) = |c_i|^2, where i=1,2,3,4.  For the Bell state | B \rangle we expect that

P(1) = 0,   P(2) = \frac{1}{2}P(3) = \frac{1}{2} and P(4) = 0.

However, in the real experiment (because of the finite number of measurements as well as due to the quantum errors) the obtained results might differ. Let us firstly check what are the probabilities obtained by running the algorithm on the simulator of quantum computer provided by IBM. By executing the algorithm 1000 times we obtain the following result:

P(1) = 0,   P(2) = 0.515P(3) = 0.485 and P(4) = 0.

Simulator

The result is in high compliance with the theoretical predictions. Finally, running the true quantum computer IBM Q 5 Tenerife (performing 1024 runs) we obtained:

P(1) = 0.104,   P(2) = 0.503P(3) = 0.368 and P(4) = 0.024.

Tenerife

Presence of the undesirable contributions from the states |00\rangle and |11\rangle is due to the errors of the quantum gates, which are still quite significant. Reduction of this error is crucial for the future utility of quantum computers.

This introduction is of course only the beginning of the story. If you find the subject interesting let me recommend you some further reading and watching:

  1. Artur Ekert, Patrick Hayden, Hitoshi Inamori, Basic concepts in quantum computation [arXiv:quant-ph/0011013].
  2. IBM Q experience Documentation, User Guide.
  3. Quantum software, Nature, Insight, 
  4. https://www.youtube.com/watch?v=JRIPV0dPAd4&t=959s

 

© Jakub Mielczarek