Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124

OpenAI wprowadza kolejną innowację do swojego narzędzia ChatGPT. Zaawansowany tryb głosowy, znany dotąd z analizy dźwięku, zyskuje możliwość analizy wideo w czasie rzeczywistym. Nowa funkcja jest już dostępna dla użytkowników z subskrypcjami Plus i Pro, choć jej wdrożenie w Europie pozostaje wciąż na etapie planowania.
Rozszerzenie funkcji trybu głosowego o analizę wideo pozwala ChatGPT na interpretację treści wizualnych w trakcie ich odtwarzania. Podobnie jak w przypadku analizy audio, chatbot potrafi w czasie rzeczywistym odpowiadać na pytania dotyczące przedstawionych w filmie szczegółów. Przykładowo, w demonstracji udostępnionej przez Kevina Weila, lidera produktu w OpenAI, ChatGPT poprawnie zidentyfikował osoby w przebraniu Świętego Mikołaja i renifera na filmie na żywo.
Nowa funkcjonalność jest kolejnym krokiem w rozwijaniu zdolności wielomodalnych chatbotów, ale pozostaje niedostępna dla europejskich użytkowników. OpenAI zapowiada, że możliwość analizy wideo trafi na ten rynek w przyszłości, jednak konkretna data wdrożenia nie została jeszcze podana.
Użytkownicy w Europie, a także klienci korporacyjni i edukacyjni, muszą więc uzbroić się w cierpliwość.