Smartfonowe ostrzeżenia przed trzęsieniami ziemi działają tylko wtedy, gdy użytkownicy im wierzą. Analiza wpisów z mediów społecznościowych pokazuje, że w praktyce „dokładność” systemu bywa rozumiana inaczej niż w inżynierii.
Test w warunkach realnego zagrożenia
Trzęsienie ziemi o magnitudzie 6,2, które 23 kwietnia 2025 roku uderzyło w rejon Marmara Ereğlisi w Turcji, stało się sprawdzianem dla smartfonowych systemów wczesnego ostrzegania. Było to najsilniejsze zdarzenie sejsmiczne w tej części kraju od ćwierćwiecza, a więc sytuacja, w której technologia nie mogła liczyć na taryfę ulgową.
W tym przypadku alerty na telefonach dotarły do milionów osób i – co kluczowe – w wielu lokalizacjach dały ponad minutę przewagi przed najsilniejszymi wstrząsami w obszarach miejskich. Taki zapas czasu nie brzmi spektakularnie, ale w praktyce pozwala przerwać niebezpieczne czynności, odejść od okien, zatrzymać pojazd czy po prostu przyjąć bezpieczniejszą pozycję.
Co mówią ludzie, a nie wykresy
Ocena działania ostrzeżeń zwykle opiera się na metrykach technicznych: precyzji wykrycia, opóźnieniach transmisji, zasięgu. Badacze postanowili jednak zajrzeć w miejsce, gdzie reakcje są natychmiastowe i często bezpośrednie: do publicznych wpisów w mediach społecznościowych.
Przeanalizowano ponad 500 postów z platformy X, a do „czytania” i porządkowania treści wykorzystano duże modele językowe. Z takiego materiału wyodrębniono 42 atrybuty opisujące doświadczenie użytkownika i jego zachowanie: od oceny czasu nadejścia alertu, przez emocje, po deklaracje dotyczące przyszłego zaufania i stosowania się do zaleceń.
Agenty AI jako narzędzie badania opinii
Wykorzystanie modeli językowych w tego typu analizie ma prosty sens: ręczne kodowanie setek krótkich, chaotycznych wypowiedzi jest czasochłonne i podatne na rozbieżności między osobami oceniającymi. Agenty AI potrafią natomiast konsekwentnie wyłuskać powtarzające się wątki, nazwać je i ujednolicić, co ułatwia późniejsze porównania statystyczne.
To nie znaczy, że problem znika. Wpisy w mediach społecznościowych są niereprezentatywne (piszą najczęściej osoby najbardziej poruszone), a język bywa ironiczny lub skrótowy. Dlatego warto traktować takie wnioski jako „termometr nastrojów” i źródło hipotez, a nie jedyny dowód skuteczności systemu.
Zaufanie rośnie wraz z punktualnością
Najmocniejszy sygnał z analizy jest intuicyjny, ale ważny: zaufanie użytkowników silnie wiąże się z tym, czy ostrzeżenie przyszło na czas. Jeśli alert pojawia się wyraźnie przed wstrząsami, ludzie uznają go za wiarygodny i przydatny; jeśli przychodzi w trakcie lub po fakcie, bywa odbierany jako zbędny hałas.
Wynik ten ma konsekwencje dla projektowania całego doświadczenia. Nawet technicznie „poprawny” system, który wykrywa zdarzenie, ale nie daje realnej przewagi czasowej, może tracić kapitał zaufania szybciej, niż wynikałoby to z inżynierskich raportów.
Dwie definicje „dokładności”
Badanie pokazuje też ciekawą rozbieżność: inżynierowie mówią o dokładności w kategoriach trafności detekcji i minimalizacji fałszywych alarmów, natomiast użytkownicy często sprowadzają ją do jednego pytania: „czy to było wystarczająco wcześnie?”. W ich odczuciu punktualność staje się synonimem dokładności.
To przesunięcie znaczeń jest kluczowe, bo wpływa na akceptację technologii. System może mieć świetne parametry w laboratorium, a jednocześnie przegrywać w odbiorze społecznym, jeśli komunikat nie przekłada się na praktyczną możliwość działania.
Co można poprawić w samych alertach
Wnioski z analizy wpisów mogą być użyteczne przy dopracowywaniu treści i formy powiadomień. Jeśli czas jest najważniejszy, komunikat powinien jasno mówić, co użytkownik ma zrobić „tu i teraz”, bez przeładowania informacjami. W stresie liczy się prostota: krótka instrukcja, czytelny sygnał i spójność między kolejnymi alertami.
Równie istotne jest zarządzanie oczekiwaniami. Wczesne ostrzeganie nie jest prognozą z wyprzedzeniem godzin, tylko automatycznym „wyścigiem z falą sejsmiczną”. Gdy ludzie rozumieją ograniczenia, łatwiej akceptują sytuacje graniczne, w których przewaga czasowa jest mniejsza.
Edukacja i badania zachowań jako brakujące ogniwo
Autorzy wskazują, że same ulepszenia techniczne nie wystarczą bez działań edukacyjnych. Kampanie informacyjne powinny tłumaczyć, skąd biorą się różnice w czasie ostrzeżeń między dzielnicami czy miastami oraz dlaczego czasem alert może dotrzeć „za późno”, mimo że system zadziałał zgodnie z założeniami.
Jednocześnie to zaproszenie do dalszych badań behawioralnych: jak ludzie faktycznie reagują na alerty, czy zmieniają nawyki, czy uczą się z kolejnych zdarzeń. W regionach sejsmicznie aktywnych skuteczność systemu to nie tylko algorytm i sieć czujników, ale też psychologia zaufania i jakość komunikacji w krytycznych sekundach.
Oryginalny tekst: Leveraging LLMs and Social Media to Understand User Perception of Smartphone-Based Earthquake Early Warnings