Microsoft chce wysunąć generatywną sztuczną inteligencję na pierwszy plan systemu operacyjnego Windows i komputerów, na których jest uruchomiony.
W dwóch przemówieniach wygłoszonych podczas corocznej konferencji Build Developer w tym tygodniu firma zaprezentowała nową gamę urządzeń z systemem Windows, którą nazywa Copilot + PC, a także funkcje generatywne oparte na sztucznej inteligencji, takie jak Recall, które pomagają użytkownikom znajdować aplikacje, pliki i inną zawartość potrzebują. Szukają jej. widziane w przeszłości. Copilot, marka Microsoft zajmująca się generatywną sztuczną inteligencją, wkrótce zostanie znacznie głębiej zintegrowana z systemem Windows 11. Nowe urządzenia Microsoft Surface są już w drodze.
Tutaj zebraliśmy wszystkie najważniejsze ogłoszenia z poniedziałku i wtorku.
Aplikacje wolumetryczne
Microsoft wprowadza aplikacje wolumetryczne systemu Windows — zasadniczo interaktywne, przestrzennie świadome aplikacje rzeczywistości wirtualnej — do zestawu słuchawkowego Meta Quest. Microsoft twierdzi, że współpracując z Meta, zapewni łączność z systemem Windows 365 i lokalnym komputerem PC z zestawem słuchawkowym Quest, umożliwiając programistom rozszerzenie swoich aplikacji na przestrzeń 3D.
Podczas wtorkowego przemówienia Microsoft pokazał cyfrowy render 3D konsoli Xbox z perspektywy zestawu słuchawkowego Meta Quest 3 — cyfrowego obiektu, którym użytkownicy mogą manipulować rękami. „Pogłębiamy naszą współpracę z firmą Meta, aby zapewnić pierwszorzędne doświadczenie systemu Windows na urządzeniach Quest” – powiedział podczas prezentacji Pavan Davuluri, wiceprezes wykonawczy ds. systemu Windows i urządzeń w firmie Microsoft.
Deweloperzy mogą Zarejestruj się, aby zobaczyć Aby uzyskać dostęp do nowego interfejsu API woluminów firmy Microsoft.
Drugi pilot + komputery
Komputery Copilot+ reprezentują wizję Microsoft dotyczącą przełomowych urządzeń z systemem Windows, w których zastosowano sztuczną inteligencję. Wszystkie zawierają dedykowane chipy zwane NPU, które wspomagają eksperymenty AI, takie jak Recall. Jest dostarczany z co najmniej 16 GB pamięci RAM w połączeniu z dyskiem SSD.
Pierwsze komputery Copilot+ będą wyposażone w procesor Qualcomm Snapdragon Producenci chipów Intel i AMD są również zaangażowani w tworzenie procesorów dla urządzeń Copilot+ we współpracy z wieloma producentami, w tym Acer, Asus, Dell, HP, Lenovo i Samsung.
Ceny komputerów Copilot+ zaczynają się od 999 dolarów, a niektóre z nich można już zamawiać w przedsprzedaży.
Surface Pro i Surface Laptop
Nowo zaprezentowane urządzenia Surface firmy Microsoft, Surface Laptop i Surface Pro, skupiają się na wydajności i baterii.
Najnowszy laptop Surface — dostępny z wyświetlaczem o przekątnej 13,8 lub 15 cali — został przeprojektowany, zapewniając „nowoczesne linie” i węższe ramki ekranu. Firma twierdzi, że urządzenie wytrzymuje do 22 godzin na jednym ładowaniu, czyli aż o 86% szybciej niż Surface Laptop 5. Obsługuje także Wi-Fi 7 i ma pojemnościowy touchpad.
Jeśli chodzi o nowy Surface Pro, Microsoft twierdzi, że jest on nawet o 90% szybszy od Surface Pro poprzedniej generacji (Surface Pro 9), ma nowy wyświetlacz OLED z wyświetlaczem HDR, Wi-Fi 7 (i opcjonalnie 5G) oraz Ulepszony ultraszerokokątny aparat przedni. A odłączana klawiatura – wzmocniona dodatkowym włóknem węglowym – ma teraz dotykowe sprzężenie zwrotne.
On pamięta
Nadchodząca funkcja przywracania w systemie Windows 11 może „zapamiętać”, do których aplikacji i treści użytkownik korzystał na swoim komputerze kilka tygodni lub nawet miesięcy temu, na przykład pomagając mu znaleźć czat na Discordzie, na którym omawiał ubrania, które zamierzał kupić. Użytkownicy mogą korzystać z osi czasu Recall, aby „przewijać wstecz”, aby zobaczyć, nad czym pracowali w niedawnej przeszłości, i zagłębiać się w pliki, takie jak prezentacje programu PowerPoint, w celu przeglądania informacji, które mogą być istotne dla ich wyszukiwań.
Microsoft twierdzi, że Recall może tworzyć powiązania między kolorami, obrazami i nie tylko, aby umożliwić użytkownikom wyszukiwanie praktycznie wszystkiego na swoich komputerach w języku naturalnym (podobnie jak technologia startupu Rewind); Programiści będą mogli poprawić zapamiętywanie, dodając informacje kontekstowe do swoich aplikacji. Microsoft twierdzi, że wszystkie dane użytkownika powiązane z Recall pozostają prywatne i znajdują się na urządzeniu i nie służą do uczenia modeli AI, co jest istotne.
Tutaj więcej Od Microsoft: „Twoje migawki są Twoje; pozostają lokalne na Twoim komputerze. Możesz usuwać pojedyncze migawki, dostosowywać i usuwać zakresy czasu w ustawieniach lub wstrzymywać w dowolnym momencie bezpośrednio za pomocą ikony w zasobniku systemowym na pasku zadań filtruj aplikacje i strony internetowe, aby nigdy nie zostały zapisane.
Edycja obrazu i tłumaczenia na żywo
W systemie Windows jest teraz więcej sztucznej inteligencji niż kiedykolwiek wcześniej, a niektóre z nich są dostępne wyłącznie w nowych komputerach Copilot+.
Nowa funkcja o nazwie Supersolution może przywracać stare zdjęcia poprzez automatyczne ich skalowanie. Copilot może teraz analizować obrazy, aby dać użytkownikom pomysły na kreatywne kompozycje. Dzięki funkcji o nazwie Cocreator użytkownicy mogą tworzyć obrazy, a także pozwolić modelowi AI podążać za tym, co rysują, aby zmienić lub przeprojektować obraz.
W innych miejscach napisy na żywo z napisami tłumaczą każdy dźwięk przechodzący przez komputer – czy to z YouTube, czy z pliku lokalnego – na język wybrany przez użytkownika. Tłumaczenia na żywo będą początkowo obsługiwać około 40 języków, w tym angielski, hiszpański, mandaryński i rosyjski.
Odrębna, ale powiązana nowa funkcja w przeglądarce Microsoft Edge zapewnia tłumaczenie wideo w czasie rzeczywistym w witrynach takich jak LinkedIn, YouTube, Coursera, Reuters, CNBC, Bloomberg i innych. Ta funkcja, która ma zostać udostępniona w najbliższej przyszłości, obsługuje tłumaczenie z języka hiszpańskiego na angielski, z angielskiego na niemiecki, hindi, włoski, rosyjski i hiszpański, a także tłumaczy treści mówione za pomocą dubbingu i napisów na żywo.
Drugi pilot i akcesoria
Team Copilot to najnowsze rozszerzenie rosnącego portfolio Copilot firmy Microsoft obejmującego generatywne technologie AI. Integruje się z Teams, firmową aplikacją do wideokonferencji, aby pomóc w zarządzaniu planami spotkań i sporządzaniu notatek, których współautorem może być każdy uczestnik spotkania. Obejmuje Loop i Planner, platformy współpracy i planowania firmy Microsoft, umożliwiające tworzenie i przydzielanie zadań, śledzenie terminów i powiadamianie członków zespołu, gdy potrzebny jest ich wkład.
W nieco powiązanych wiadomościach dotyczących usługi Copilot firma Microsoft uruchomiła (w prywatnej wersji zapoznawczej) rozszerzenia Copilot, które umożliwiają programistom rozszerzanie własnego narzędzia do generowania kodu GitHub Copilot o aplikacje i umiejętności innych firm. Partnerami startowymi są DataStax, Docker i LambdaTest; Rozszerzenia będą znajdować się w GitHub Marketplace, ale programiści będą mogli także tworzyć własne rozszerzenia w celu integracji z ich wewnętrznymi systemami i interfejsami API.
Środowisko wykonawcze Copilot w systemie Windows
Funkcje takie jak Recall i Supersolution wyłączane są przez Windows Copilot Runtime, zbiór około 40 generatywnych modeli sztucznej inteligencji, które tworzą to, co Microsoft określa jako „nową warstwę” systemu Windows. W połączeniu z Semantic Index, systemem wektorowym natywnym dla pojedynczego komputera Copilot+, środowisko Windows Copilot Runtime umożliwia uruchamianie aplikacji opartych na sztucznej inteligencji – w tym aplikacji innych firm – bez konieczności konieczności połączenia z Internetem.
„[The runtime] Zawiera gotowe do użycia interfejsy API AI, takie jak Studio Effects, Live Captions, OCR, Recall z aktywnością użytkownika i [more]Davuluri powiedział we wtorek, że aplikacja będzie dostępna dla programistów w czerwcu.
Microsoft twierdzi, że CapCut, popularny edytor wideo firmy ByteDance, właściciela TikToka, będzie korzystać ze środowiska wykonawczego Windows Copilot Runtime i towarzyszącej mu nowej biblioteki Windows Copilot, zestawu interfejsów API i narzędzi programistycznych do tworzenia sztucznej inteligencji, aby przyspieszyć działanie funkcji sztucznej inteligencji. Meta doda powyższe efekty studyjne do WhatsApp, aby oferować funkcje takie jak rozmycie tła i kontakt wzrokowy podczas rozmów wideo.
Ulepsz konstruktorów robotów
Azure AI Studio, zestaw narzędzi w ramach usługi Azure OpenAI firmy Microsoft, który umożliwia klientom łączenie modelu sztucznej inteligencji i tworzenie aplikacji, która „myśli” o tych danych, wkrótce umożliwi programistom tworzenie aplikacji przy użyciu interfejsów API wnioskowania typu „płatność zgodnie z rzeczywistym użyciem” — Interfejsy API, do których programiści mogą uzyskiwać dostęp i dostrajać generatywne modele sztucznej inteligencji hostowane w infrastrukturze platformy Azure. Microsoft nazywa to „modelem usługi” i na początek wprowadza na rynek modele Nixtla i Core42.
W sąsiadującym pakiecie produktów Copilot Studio Microsoft wprowadza agentów Copilot, których firma opisuje jako boty AI, które mogą „autonomicznie koordynować zadania dostosowane do określonych ról i funkcji”. (Copilot Studio zapewnia narzędzia do łączenia Copilot dla Microsoft 365, „drugiego pilota” opartego na sztucznej inteligencji w aplikacjach takich jak Excel i Word, z danymi innych firm.) Wykorzystując pamięć i wiedzę kontekstową, agenci Copilot mogą poruszać się po różnych typach biznesowych przepływów pracy, uczenie się na podstawie komentarzy użytkowników i proszenia o pomoc, gdy napotykają sytuacje, z którymi nie wiedzą, jak sobie poradzić.
Zestaw rozwojowy Snapdragona
Dostępny jest nowy zestaw programistyczny firmy Qualcomm przeznaczony dla programistów tworzących aplikacje dla komputerów Copilot+ wyposażonych w chipy Arm
Zestaw Snapdragon Dev Kit dla systemu Windows za 899,99 USD — który ma mniej więcej taką samą szerokość, wysokość i długość jak komputer Mac Mini firmy Apple — zawiera procesor Qualcomm Snapdragon i wiele operacji we/wy. Zestaw deweloperski obsługuje Wi-Fi 7 i Bluetooth 5.4, a dzięki różnym portom USB-C i HDMI może jednocześnie zasilać do trzech wyświetlaczy 4K.
PHI-3
Firma Microsoft ogłosiła dodanie do rodziny modeli generatywnej sztucznej inteligencji Phi, Phi-3-vision, który może wykonywać ogólną analizę wizualną i zadania wnioskowania, takie jak odpowiadanie na pytania dotyczące wykresów i obrazów. Model potrafi czytać zarówno tekst, jak i obrazy i jest na tyle wydajny, że można go uruchomić na urządzeniu mobilnym.
Phi-3-vision jest dostępny w wersji zapoznawczej, natomiast wcześniej zapowiadane tekstowe odpowiedniki modelu – Phi-3-mini, Phi-3-small i Phi-3-medium – są teraz ogólnie dostępne.
Współpraca z Khan Academy
Microsoft współpracuje z Khan Academy, aby zapewnić dostęp do infrastruktury przetwarzania w chmurze, umożliwiając Khan Academy zapewnienie nauczycielom w Stanach Zjednoczonych bezpłatnego dostępu do narzędzi Khan Academy opartych na sztucznej inteligencji. Microsoft powiedział we wtorek, że obie firmy będą również współpracować w celu zbadania możliwości ulepszenia aplikacji AI w nauczaniu matematyki za pomocą generatywnej sztucznej inteligencji.
Uruchamiamy biuletyn oparty na sztucznej inteligencji! Subskrypcja Tutaj Aby zacząć je otrzymywać w swoich skrzynkach odbiorczych od 5 czerwca.
More Stories
Premiera PlayStation 5 Pro planowana jest za kilka tygodni
Kuo: Aktualizacja pamięci RAM do 12 GB w przyszłym roku będzie ograniczona do iPhone’a 17 Pro Max
Firma zajmująca się sztuczną inteligencją Midjourney zapowiada produkt sprzętowy w nowej formie