Naukowcy z MIT używają cieni, aby zobaczyć, co jest tuż za kamerą

[ad_1]

Sztuczna inteligencja może wkrótce pomóc kamerom wideo zobaczyć kłamstwa tuż poza tym, co widzi soczewka – za pomocą cieni. Naukowcy z laboratorium informatyki i sztucznej inteligencji MIT (CSAIL) opracowali algorytm, który „widzi” to, co wychodzi z klatki wideo, analizując cienie i cienie tworzone przez obiekty poza polem widzenia. Badanie, Blind Inverse Light Transport, Deep Matrix Factorization, opublikowano dzisiaj, 6 grudnia.

Algorytm działa prawie jak czytanie lalek cienia w odwrotnej kolejności – komputer widzi cień w kształcie króliczka, a następnie jest w stanie oszacować obiekt, który go utworzył. Komputer nie wie, co to jest za przedmiot, ale może z grubsza zarysować kształt.

Naukowcy wykorzystali cienie i geometrię, aby nauczyć program przewidywania transportu światła lub tego, jak światło porusza się w scenie. Kiedy światło uderza w obiekt, rozprasza się, tworząc cienie i światła. Zespół badawczy pracował nad „rozszyfrowaniem” tego światła ze wzoru cieniowania, cieni i świateł. Dalsze udoskonalenia pomogły komputerowi oszacować najbardziej prawdopodobny kształt spośród wszystkich potencjalnych możliwości.

Dzięki zrozumieniu tego, jak porusza się światło, algorytm może następnie z grubsza odtworzyć obiekt, który utworzył ten cień, nawet jeśli sam obiekt nie znajduje się w filmie. Algorytm opiera się na dwóch sieciach neuronowych, jednej do „rozszyfrowania”, a drugiej do generowania obrazu wideo tego, jak ten obiekt wygląda.

Algorytm tworzy pikselową sylwetkę kształtu i jego ruch. To nie wystarcza do stworzenia kamery szpiegowskiej, która widzi wokół rogów, ale pomaga tworzyć te sceny CSI gdzie śledczy wyciągają szczegóły, których wcześniej nie było, bardziej prawdopodobne.

Naukowcy sugerują, że przy dalszym udoskonalaniu technologia ta mogłaby zostać wykorzystana do takich zastosowań, jak poprawa wizji samochodów samojezdnych. Po odczytaniu informacji o cieniu samochód może potencjalnie zobaczyć obiekt, który ma przejść przez jezdnię, zanim jeszcze znajdzie się w polu widzenia kamery. Ta aplikacja jest jeszcze daleka – naukowcy twierdzą, że odtworzenie tajemniczego obiektu zajmuje obecnie około dwóch godzin.

Badania opierają się na podobnych pracach innych badaczy MIT, którzy używali specjalnych laserów, aby zobaczyć, czego aparat nie może. Nowe badania działają bez dodatkowego sprzętu poza aparatem, komputerem i oprogramowaniem.

Zalecenia redaktorów






[ad_2]