A Xiaomi ma hivatalosan bejelentette Kínában a Xiaomi miclaw korlátozott zárt béta tesztelését, ami fontos mérföldkő az AI ügynök technológiában.
A Xiaomi MiMo nagy modellen alapuló eszköz lehetővé teszi, hogy egyetlen mondatos parancsokkal irányítható legyen a Xiaomi okostelefon és az okosotthon eszközök.
Az ügynök képes megérteni az összetett szándékokat, megjegyzi a felhasználói szokásokat, sőt az előfizetési számlák elemzésével megtakarítására is javaslatot tehet. Ez a meghívásos teszt jelenleg a legújabb Xiaomi 17 Ultra és Pro modellekhez érhető el.
Mi az a Xiaomi miclaw?
A Xiaomi miclaw egy fejlett AI alapú interakciós megoldás, amelynek célja, hogy egy hagyományos okostelefont proaktív digitális asszisztensé alakítson. A hagyományos hangasszisztensekkel szemben, amelyek egyszerű aktiváló parancsokra reagálnak, ez a rendszer a Xiaomi MiMo nagy modellen alapul, így képes megérteni az emberi szándékot és több lépésből álló folyamatokat végrehajtani.
A rendszer egy központi rendszeralkalmazásként működik, amely önállóan több mint 50 különböző rendszereszközt és ökoszisztéma szolgáltatást tud igénybe venni, hogy összetett feladatokat hatékonyan hajtson végre.
A szoftver annál hatékonyabbá válik, minél többet használják, köszönhetően a fejlett memória rendszernek. Az engedélyezett adatok, például naptáresemények vagy SMS értesítések elemzésével intelligens döntéseket tud hozni, például értekezlet közben némítja a telefont vagy szünetelteti a robotporszívót. Ez a Xiaomi HyperConnect ökoszisztéma következő lépése, amely természetes nyelven keresztül kapcsolja össze a mobilos szoftvereket és az IoT hardvereket.
Hogyan működik a Xiaomi miclaw?
A Xiaomi miclaw technikai felépítése egy fejlett következtetés-végrehajtás ciklusra épül, amely folyamatos visszacsatolási folyamaton keresztül dolgozza fel a felhasználói bemenetet. A rendszer elemzi a hangos vagy szöveges parancsot, kiválasztja a megfelelő eszközt, majd végrehajtja a műveletet, miközben valós időben figyeli az eredményt.
Ez a folyamat aszinkron módon zajlik, így a rendszer akkor is gyors marad, amikor összetett háttérszámításokat végez, vagy különböző IoT eszközökkel kommunikál a Xiaomi HyperConnect protokollokon keresztül.
Önálló feladat végrehajtás
A Xiaomi miclaw önállóan ki tudja választani a rendszerszintű eszközöket és a harmadik féltől származó alkalmazásokat homályos parancsok végrehajtásához. Engedély megadása után az AI értelmezi az igényeket, és kézi beavatkozás nélkül végrehajtja a több lépésből álló folyamatokat.
Fejlett memória rendszer
A központi motor egy fejlett memória rendszert használ, amely megőrzi a kulcsfontosságú döntési pontokat és tömöríti az interakciók előzményeit. Ennek köszönhetően az AI akár 20 egymást követő lépésen keresztül is képes megőrizni a kontextust, így hosszabb feladatoknál is érti az eredeti célt
Okosotthon vezérlés
A teljes Mi Home protokoll integrációjával az ügynök a gép által értelmezhető specifikációkat természetes nyelvű leírásokká alakítja. Így képes kezelni a légkondicionálókat, világítást és biztonsági rendszereket az okosotthon hálózatban.
Támogatott eszközök
Ez az első béta teszt kizárólag a kínai Xiaomi 17 Ultra Leica Edition, Xiaomi 17 Ultra, Xiaomi 17 Pro Max, Xiaomi 17 Pro és a standard Xiaomi 17 modelleken érhető el
A szoftver támogatja a Model Context Protocol (MCP) rendszert és egy dedikált Open SDK csomagot a külső fejlesztők számára. Az alkalmazások előre jelezhetik a képességeiket, így az AI dinamikusan fel tudja fedezni és használni az új funkciókat
A Xiaomi megerősítette, hogy ezekből az interakciókból származó személyes adatokat nem használják fel a modellek tanítására. A feldolgozás nagy része helyben történik edge-cloud alapú adatvédelmi számítással, így az érzékeny információk a telefonon maradnak biztonságban
A Xiaomi bejelentése
Akit érdekelnek a további részletek, az itt találja a Xiaomi teljes bejelentését (kínairól fordítva, előfordulhatnak pontatlanságok!).
A Xiaomi miclaw egy kis lépés az Agent irányába tett kutatásban. Ez egy AI-interakciós teszttermék, amely a Xiaomi MiMo nagy modelljére épül, és ma indul a korlátozott, zárt tesztelés. A Xiaomi miclaw elsősorban azt vizsgálja, hogy a nagy modellek mennyire képesek végrehajtási feladatokra a Xiaomi „ember–autó–otthon teljes ökoszisztéma” rendszerében, és azt kutatja, hogyan léphet át a modell a „párbeszédképességből” a „rendszerszintű végrehajtási képességbe”. A működése négy szintre épül: rendszeralap képességek, személyes kontextus megértése, ökoszisztéma-kapcsolódás, valamint önfejlődés
Lehetővé teszi, hogy a telefon az AI eszközévé váljon. A szándék felismerése és az engedély megadása után képes első féltől származó alkalmazásokat és ökoszisztéma-képességeket hívni, vagy önállóan rendszerszintű eszközöket választani a feladat végrehajtásához. Felismeri a felhasználót, emlékszik rá, és egy homályosan megfogalmazott feladatból is képes következtetni, majd elvégezni a szükséges műveleteket. Folyamatosan fejlődik, képes módosítani a saját működését, bővíteni a képességeit, végül pedig a memóriarendszerben eltárolja a tapasztalatokat, így minél többet használják, annál jobban érti a felhasználót
Mivel ez egy kísérleti, élvonalbeli fejlesztés, a stabilitás, az energiafogyasztás és az összetett helyzetekben elért végrehajtási sikeresség még folyamatos optimalizálás alatt áll. Egyes nagy bonyolultságú feladatoknál előfordulhat, hogy a végrehajtás hatékonysága ingadozik, vagy időszakosan sikertelen. A mostani zárt teszt nem nyilvános jelentkezéssel történik, hanem meghívásos alapon. Ismét fontos kiemelni, hogy a frissítés nem ajánlott mindennapi fő eszközön. Inkább technológiai rajongóknak és intenzív AI-felhasználóknak javasolt, előzetes adatmentéssel és ellenőrzött környezetben történő kipróbálással
01 Rendszeralap képességek: amikor az AI valóban cselekedni tud
Miért alapfeltétel a rendszeridentitás
A Xiaomi miclaw rendszeralkalmazásként fut, és rendelkezik a rendszer alapalkalmazásainak képességeivel
Az alkalmazás sandboxában futó AI, bármilyen erős modellre is épül, leginkább kérdések megválaszolására és internetes keresésre képes. A rendszerszintű AI viszont más, mert rendszerszintű vezérlést is tud biztosítani
50+ rendszerszintű eszköz
A Xiaomi miclaw a telefon rendszerképességeit több mint 50 rendszerfunkcióba és ökoszisztéma-szolgáltatásba csomagolja (a lista folyamatosan bővül)
Minden eszköz strukturált paramétereket kap, és végrehajtási eredményt ad vissza. Az elérhető eszközök attól függnek, hogy a felhasználó milyen engedélyeket adott
Nagy modellre épülő következtetés-végrehajtás motor
Az eszközök önmagukban nem elegendők. A kulcs az, hogy a modell maga döntse el a hívások sorrendjét. A Xiaomi miclaw központi motorja egy következtetés-végrehajtás ciklus
Felhasználói bevitel → modell következtetés (eszköz kiválasztása, paraméterek meghatározása) → eszköz végrehajtás → eredmény visszaküldése → modell újabb következtetés → … → feladat befejezése, válasz
A modell minden lépésnél maga dönt arról, melyik eszközt hívja meg, milyen paraméterekkel, és hogy a feladat elkészült-e. Az eszközök végrehajtását külön időkorlát védi, az egész rendszer aszinkron architektúrán fut, így nem blokkolja a rendszerfolyamatokat
Az alsó réteg egységes absztrakciót biztosít a főbb nagy modell protokollokhoz, így modellcsere esetén nem kell módosítani a felső logikát. A felhasználói oldalon az élmény folyamatos frissítésként jelenik meg: látható, melyik eszközt hívja az AI és melyik lépésnél tart
Kontextuskezelés: több körös párbeszédnél sem vész el a lényeg
A hosszú beszélgetések nem szakadnak meg, több eszközhívásnál a legnagyobb gond, ha „közben elfelejtődik a kiinduló cél”. A Xiaomi miclaw háromszintű intelligens memóriakezelést használ: automatikusan megőrzi a fontos döntési pontokat, dinamikusan tömöríti a felesleges interakciókat, a kulcsutasításokat pedig helyi gyorsítótárban optimalizálja. Még 20 egymást követő, összetett műveletnél is emlékszik az eredeti igényre, így nincs szükség ismételt magyarázatra, a szolgáltatás végig következetes marad
Fordulótömörítés: a régi beszélgetések összetömörítése, a legutóbbi interakciók kiemelésével
Token tömörítés: a kontextusablak felső határához közeledve intelligens tömörítés üzenetszinten
A rendszer promptjai többszintű kialakítást kapnak, és a dinamikus információk az első felhasználói üzenetbe kerülnek be. Így a prompt egy része a modell gyorsítótárába kerülhet, ami a mérések szerint 50-90% tokenhasználat-csökkenést eredményez
02 Személyes kontextus: amikor az AI valóban érti a felhasználót
A „mit mondtál” szintről a „hogyan élsz” szintre
A hagyományos AI-asszisztenseknek kevés kontextus áll rendelkezésükre, általában csak az aktuális üzenetre figyelnek. A Xiaomi miclaw felhasználói engedéllyel a használati szokások alapján nyújt szolgáltatást
„Érzékelés → kapcsolás → döntés → cselekvés”
A hagyományos alkalmazások csak „érzékelés → cselekvés” módon működnek: érkezik egy értesítés, megjelenik az értesítés. A Xiaomi miclaw két lépést iktat közéjük, a kapcsolást és a döntést. Ez az AI Agent és a hagyományos szoftver közötti határ
Példa: utazás előkészítése
Értesítés érkezik: „Jegyvásárlás sikeres G1234 Peking → Csengtu péntek 08:30”. Ezután a következő történik
7 lépés automatikusan lefut, 6 külön eszköz összekapcsolásával. A modell következtetési képessége fontos, de az alapfeltétel az, hogy az AI hozzáférjen az SMS-ekhez és a naptárhoz
Példa: fogyasztási elemzés
Banki terhelésről szóló SMS → AI elolvassa az elmúlt 3 hónap üzeneteit → felismeri, hogy két videóplatform egyszerre von havidíjat → tartalmi átfedést állapít meg → hónap végén fogyasztási jelentést küld, és javasolja az egyik előfizetés lemondását, amivel évente közel 400 jüan takarítható meg
Adatbiztonság
Az adatkezelés alapelve: a beszélgetési előzmények, a felhasználói beállítások és a képességfájlok mind helyben, az eszközön tárolódnak. A felhőbe csak az aktuális beszélgetés üzenete kerül következtetés céljából, titkosított adatátvitellel, így biztosított a felhasználói adatok védelme. Az érzékeny műveleteket végző eszközök (például SMS küldése vagy esemény létrehozása) minden végrehajtás előtt megerősítést kérnek
03 Ökoszisztéma-kapcsolódás: a telefontól az egész okos életig
Amikor az AI az otthoni eszközöket is irányítja
Az előző két rész a telefonról szólt. A harmadik szint kiterjeszti az AI „kezét” a telefonon túlra, és csatlakozik a Xiaomi IoT ökoszisztémához
A Mi Home platform több mint 1 milliárd eszközt kapcsol össze. A Xiaomi miclaw teljes Mi Home protokoll klienssel rendelkezik, képes olvasni az eszközállapotokat és vezérlési parancsokat küldeni. Felhasználói engedéllyel elméletileg minden Mi Home-hoz csatlakoztatott IoT eszközt irányítani tud
A protokoll kliens egyik kulcsfeladata a „fordítás”. Az IoT eszközök képességeit általában gép által olvasható specifikációk írják le (paramétertípusok, értéktartományok, korlátozások). A Xiaomi miclaw ezt természetes nyelvű paraméterleírássá alakítja a nagy modell számára. A modell így például ilyen leírást lát: „kapcsold be a nappali klímát, paraméter: kapcsoló (be/ki)”
Példa: otthoni munkamód
Naptáresemény „10:00 fontos ügyféltalálkozó” → az AI csendes környezetet feltételez
a telefon automatikusan némít
a robotporszívó leáll
a bejövő hívásokat fontosság szerint kezeli: főnök hívásakor rezgés, futár hívása csak rögzítésre kerül
a meeting után minden eszköz visszaáll az eredeti állapotba, és összefoglaló érkezik a nem fogadott hívásokról és üzenetekről
A hagyományos okosotthon előre beállított szabályokra épül. A Xiaomi miclaw viszont a pillanatnyi kontextus alapján dönt. Ugyanaz a „meeting” más reakciót válthat ki: egy belső heti értekezletnél talán csak a telefon némul el, míg egy fontos ügyféltalálkozónál az egész lakás eszközei reagálnak. A döntés alapja lehet a naptár leírása, a korábbi szokások és az aktuális eszközállapot
Nyílt protokollos bővítés
Az ökoszisztéma nem áll meg a Xiaomi saját eszközeinél. Két nyílt csatorna teszi lehetővé a harmadik felek csatlakozását
MCP (Model Context Protocol): nyílt szabvány az AI eszközintegrációhoz. A Xiaomi miclaw teljes MCP klienssel rendelkezik, támogatja a szabványos kommunikációt, a folyamatos válaszokat és az aszinkron szolgáltatásfelderítést. A PC-n már létező több ezer MCP eszköz elméletileg közvetlenül csatlakoztatható a telefon AI-jához
Nyílt SDK: a Xiaomi miclaw harmadik fél alkalmazásai számára is elérhető SDK-t ad ki. A biztonságot aláírási szintű jogosultságvédelem biztosítja. Az alkalmazások maguk jelzik, milyen eszközképességeket tudnak biztosítani, a Xiaomi miclaw pedig dinamikusan fedezi fel és hívja őket. A logika megfordul: az alkalmazás közli az AI-val, mire képes, az AI pedig szükség szerint használja
04 Önfejlődés: az AI képességeinek folyamatos bővülése
Az eddigi három szint a Xiaomi miclaw alapértelmezett képessége. Van azonban egy még fontosabb tulajdonság: amit képes megtenni, az nincs előre rögzítve
A Xiaomi miclaw meta képessége röviden „eszközöket létrehozó eszköz”
Fájlszintű memória → tetszőleges adatstruktúra létrehozása. Az AI ezzel a képességgel maga tervezte meg a memóriarendszerét: memóriamappák létrehozása, tárolási formátumok meghatározása, lekérési szabályok írása. Minél többet használják, annál jobban ismeri a preferenciákat, a gyakori kontaktokat és a korábbi feladatokat
Alügynökök létrehozása → specializált feladatmegosztás. Minden alügynök külön prompttal és eszközlistával rendelkezik, sandbox környezetben működik. Lehet külön naptárkezelő alügynök vagy információ-összefoglaló alügynök
MCP szolgáltatás konfigurálása → külső képességek dinamikus csatlakoztatása, a használható eszközök folyamatos bővítése
Szkriptfuttatás → Python vagy JavaScript futtatása sandbox környezetben, általános programozási képességgel
Ez a négy képesség együtt ad fejlődési pályát: először a saját működését módosítja (promptok és fájlok), majd bővíti a képességeit (alügynökök és MCP kapcsolatok), végül a memóriarendszerben rögzíti a tapasztalatokat, így egyre jobban alkalmazkodik
Ezeket a folyamatokat senki sem írta meg előre. Az AI az alap eszközökből maga épített magasabb szintű használati módokat
Végszó
A rendszerszintű képességek teszik lehetővé a cselekvést, a személyes kontextus az értést, az ökoszisztéma-kapcsolódás pedig a telefonon túli irányítást. Az önfejlődés pedig mindezt folyamatosan erősíti
Amikor a nagy modellek valóban a telefon rendszerébe épülnek, maga a telefon az AI testének részévé válik


