Część 2 - współrzędne, wektory i konwencja sumacyjna

Podstawowym obiektem w OTW jest czasoprzestrzeń. Jako obiekt matematyczny formalnie jest to rozmaitość różniczkowa, ale na nasze potrzeby wystarczy fakt, że jest to pewien zbiór punktów, zwanych zdarzeniami, które można opisywać współrzędnymi. W przypadku OTW czasoprzestrzeń jest 4-wymiarowa, co oznacza, że potrzebne są 4 współrzędne - jedna czasowa i trzy przestrzenne.

Współrzędne można nazywać w zasadzie dowolnie (np. x, y, z, t), ale ponieważ wielokrotnie potrzebne będzie odwoływanie się do całej czwórki współrzędnych naraz, wygodnie jest oznaczyć je numerami. Przyjęło się oznaczać współrzędną czasową jako 0, a pozostałe 1, 2, 3. Współrzędną nr \mu będziemy zapisywać tak: x^\mu (uwaga: w tym przypadku to nie jest potęgowanie!). \mu w tym przypadku nazywane jest indeksem lub wskaźnikiem (tutaj: górnym). Konwencjonalnie, kiedy mamy na myśli jedną ze wszystkich 4 współrzędnych, używamy litery greckiej; jeśli chodzi o którąś ze współrzędnych przestrzennych, używamy liter łacińskich.

Wiemy już, jak opisywać punkty ("miejsca") w czasoprzestrzeni. Ale oprócz miejsc, jak w każdej przestrzeni, mamy też kierunki. Te opisywane są wektorami. Wektory wyglądają w zapisie bardzo podobnie do punktów - również są opisywane 4 współrzędnymi, oznaczanymi v^\mu. W tym przypadku współrzędne nie opisują jednak miejsca w przestrzeni, a proporcje przesuwania się wzdłuż konkretnych współrzędnych. Już wyjaśniam dokładniej.

Wyobraźmy sobie typową płaszczyznę, która ma współrzędne x i y. Każdy wektor na tej płaszczyźnie również będzie miał współrzędne x i y, oznaczmy je np. v_x i v_y. Można je interpretować jako przepis, że aby przesunąć się w kierunku opisywanym przez ten wektor, należy do współrzędnej x punktu dodać v_x, a do współrzędnej y dodać v_y. Np. przesunięcie się z punktu (4,3) o wektor [1,-1] przeniesie nas w punkt (5,2).

Przesuwanie się w tym kierunku nie kończy się jednak na tym jednym punkcie. Możemy iść dalej, do (6,1), (7,0), (8,-1),... Możemy wykonywać takie "kroki" ile razy nam się podoba, ale możemy też np. wykonać pół kroku, do (4.5, 2.5). Wektory [av_x, av_y] mają zatem taki sam kierunek, jak [v_x, v_y], ale różną długość. Mogą mieć też zgodny lub przeciwny zwrot (gdy a < 0).

Mając pewną funkcję w naszej przestrzeni (na płaszczyźnie będzie to f(x,y)) i jakiś wektor, możemy spytać o pochodną funkcji w kierunku tego wektora - powie nam ona, jak szybko nasza funkcja się zmienia, gdy przemieszczamy się w tę stronę. Okazuje się, że pochodna wzdłuż wektora [v_x, v_y] wynosi v_x\frac{\partial f}{\partial x} + v_y\frac{\partial f}{\partial y}. Dla funkcji w przestrzeni, w której współrzędne mamy ponumerowane indeksem \mu, możemy zapisać to tak: \sum\limits_{\mu=0}^n v^\mu \frac{\partial f}{\partial x^\mu}.

Tu warto zauważyć, że jeśli przemnożymy współrzędne wektora przez jakąś liczbę a, również wartość pochodnej funkcji wzdłuż tego wektora przemnoży się przez a. To oznacza, że im dłuższy wektor, tym większa wartość pochodnej. Można więc powiedzieć, że wektor opisuje nie tylko kierunek, ale też prędkość przemieszczania się w tym kierunku, a wartość pochodnej mówi nam, jak szybko zmienia się funkcja, gdy przemieszczamy się z taką prędkością.

Teraz znowu kilka konwencji dotyczących zapisu: po pierwsze, \frac{\partial f}{\partial x^\mu} dla wygody zapisuje się \partial_\mu f. Tu indeks mamy na dole - można to zapamiętać w ten sposób, że gdy różniczkujemy po czymś z indeksem, w wyniku indeks zmienia miejsce (z góry na dół i na odwrót). To za chwilę będzie miało znaczenie.

Mamy więc wyrażenie \sum\limits_{\mu=0}^n v^\mu \partial_\mu f. Wyrażenia z takimi sumami pojawiają się w OTW na tyle często, że nie kto inny, a sam Einstein stwierdził, że nie ma co ich pisać i wprowadził tzw. konwencję sumacyjną. Mówi ona tyle, że ilekroć w wyrażeniu pojawia się ten sam indeks raz na górze, a raz na dole, należy wysumować to wyrażenie dla wszystkich jego wartości. To pozwala na zapisanie naszego wyrażenia jako v^\mu \partial_\mu f. Ta konwencja jest głównym powodem, dla którego ważne jest, czy indeks występuje na górze, czy na dole (ma to też inne znaczenie, które jednak wykracza poza ten artykuł). Sumowanie po powtarzającym się indeksie nazywa się zwężaniem.

Przyjrzyjmy się bliżej kawałkowi naszej pochodnej kierunkowej: \partial_\mu f. Jest to n pochodnych cząstkowych funkcji f (dla n różnych wartości \mu - w przypadku czasoprzestrzeni, czterech). Wygląda to wobec tego trochę jak współrzędne punktu albo wektor, jednak ma indeks na dole, a nie na górze. Takie coś nazywa się kowektorem.

Pochodne funkcji zwykle zależą od punktu, w którym są liczone, w związku z czym współrzędne tego kowektora również będą zależały od punktu w przestrzeni. Można to traktować tak, jakbyśmy w każdym punkcie przestrzeni mieli zdefiniowany osobny kowektor, o współrzędnych równych pochodnym funkcji w tym punkcie. Nie mamy więc tutaj pojedynczego kowektora, a całe pole kowektorowe. W analogiczny sposób, gdy współrzędne wektora zależą od punktu w przestrzeni, mamy do czynienia z polem wektorowym.

Często pola wektorowe i kowektorowe nazywa się w skrócie po prostu wektorami/kowektorami - nie jest to problem, gdyż praktycznie nigdy nie rozważa się pojedynczych (ko)wektorów w jednym punkcie przestrzeni. Wobec tego zawsze, gdy napiszemy po prostu v^\mu \partial_\mu f, będziemy mieli na myśli pochodną f w kierunku v obliczoną w każdym punkcie przestrzeni z osobna.