A Xiaomi miclaw egy személyes AI asszisztens, ami tényleg mindent elintéz

A Xiaomi ma hivatalosan bejelentette Kínában a Xiaomi miclaw korlátozott zárt béta tesztelését, ami fontos mérföldkő az AI ügynök technológiában.

A Xiaomi MiMo nagy modellen alapuló eszköz lehetővé teszi, hogy egyetlen mondatos parancsokkal irányítható legyen a Xiaomi okostelefon és az okosotthon eszközök.

 

Xiaomi miclaw

 

Az ügynök képes megérteni az összetett szándékokat, megjegyzi a felhasználói szokásokat, sőt az előfizetési számlák elemzésével megtakarítására is javaslatot tehet. Ez a meghívásos teszt jelenleg a legújabb Xiaomi 17 Ultra és Pro modellekhez érhető el.

Mi az a Xiaomi miclaw?

A Xiaomi miclaw egy fejlett AI alapú interakciós megoldás, amelynek célja, hogy egy hagyományos okostelefont proaktív digitális asszisztensé alakítson. A hagyományos hangasszisztensekkel szemben, amelyek egyszerű aktiváló parancsokra reagálnak, ez a rendszer a Xiaomi MiMo nagy modellen alapul, így képes megérteni az emberi szándékot és több lépésből álló folyamatokat végrehajtani.

A rendszer egy központi rendszeralkalmazásként működik, amely önállóan több mint 50 különböző rendszereszközt és ökoszisztéma szolgáltatást tud igénybe venni, hogy összetett feladatokat hatékonyan hajtson végre.

A szoftver annál hatékonyabbá válik, minél többet használják, köszönhetően a fejlett memória rendszernek. Az engedélyezett adatok, például naptáresemények vagy SMS értesítések elemzésével intelligens döntéseket tud hozni, például értekezlet közben némítja a telefont vagy szünetelteti a robotporszívót. Ez a Xiaomi HyperConnect ökoszisztéma következő lépése, amely természetes nyelven keresztül kapcsolja össze a mobilos szoftvereket és az IoT hardvereket.

Hogyan működik a Xiaomi miclaw?

A Xiaomi miclaw technikai felépítése egy fejlett következtetés-végrehajtás ciklusra épül, amely folyamatos visszacsatolási folyamaton keresztül dolgozza fel a felhasználói bemenetet. A rendszer elemzi a hangos vagy szöveges parancsot, kiválasztja a megfelelő eszközt, majd végrehajtja a műveletet, miközben valós időben figyeli az eredményt.

Ez a folyamat aszinkron módon zajlik, így a rendszer akkor is gyors marad, amikor összetett háttérszámításokat végez, vagy különböző IoT eszközökkel kommunikál a Xiaomi HyperConnect protokollokon keresztül.

Önálló feladat végrehajtás

A Xiaomi miclaw önállóan ki tudja választani a rendszerszintű eszközöket és a harmadik féltől származó alkalmazásokat homályos parancsok végrehajtásához. Engedély megadása után az AI értelmezi az igényeket, és kézi beavatkozás nélkül végrehajtja a több lépésből álló folyamatokat.

Fejlett memória rendszer

A központi motor egy fejlett memória rendszert használ, amely megőrzi a kulcsfontosságú döntési pontokat és tömöríti az interakciók előzményeit. Ennek köszönhetően az AI akár 20 egymást követő lépésen keresztül is képes megőrizni a kontextust, így hosszabb feladatoknál is érti az eredeti célt

Okosotthon vezérlés

A teljes Mi Home protokoll integrációjával az ügynök a gép által értelmezhető specifikációkat természetes nyelvű leírásokká alakítja. Így képes kezelni a légkondicionálókat, világítást és biztonsági rendszereket az okosotthon hálózatban.

Friss tech hírek - értesülj hírlevélben

Támogatott eszközök

Ez az első béta teszt kizárólag a kínai Xiaomi 17 Ultra Leica Edition, Xiaomi 17 Ultra, Xiaomi 17 Pro Max, Xiaomi 17 Pro és a standard Xiaomi 17 modelleken érhető el

A szoftver támogatja a Model Context Protocol (MCP) rendszert és egy dedikált Open SDK csomagot a külső fejlesztők számára. Az alkalmazások előre jelezhetik a képességeiket, így az AI dinamikusan fel tudja fedezni és használni az új funkciókat

A Xiaomi megerősítette, hogy ezekből az interakciókból származó személyes adatokat nem használják fel a modellek tanítására. A feldolgozás nagy része helyben történik edge-cloud alapú adatvédelmi számítással, így az érzékeny információk a telefonon maradnak biztonságban

A Xiaomi bejelentése

Akit érdekelnek a további részletek, az itt találja a Xiaomi teljes bejelentését (kínairól fordítva, előfordulhatnak pontatlanságok!).

A Xiaomi miclaw egy kis lépés az Agent irányába tett kutatásban. Ez egy AI-interakciós teszttermék, amely a Xiaomi MiMo nagy modelljére épül, és ma indul a korlátozott, zárt tesztelés. A Xiaomi miclaw elsősorban azt vizsgálja, hogy a nagy modellek mennyire képesek végrehajtási feladatokra a Xiaomi „ember–autó–otthon teljes ökoszisztéma” rendszerében, és azt kutatja, hogyan léphet át a modell a „párbeszédképességből” a „rendszerszintű végrehajtási képességbe”. A működése négy szintre épül: rendszeralap képességek, személyes kontextus megértése, ökoszisztéma-kapcsolódás, valamint önfejlődés

Lehetővé teszi, hogy a telefon az AI eszközévé váljon. A szándék felismerése és az engedély megadása után képes első féltől származó alkalmazásokat és ökoszisztéma-képességeket hívni, vagy önállóan rendszerszintű eszközöket választani a feladat végrehajtásához. Felismeri a felhasználót, emlékszik rá, és egy homályosan megfogalmazott feladatból is képes következtetni, majd elvégezni a szükséges műveleteket. Folyamatosan fejlődik, képes módosítani a saját működését, bővíteni a képességeit, végül pedig a memóriarendszerben eltárolja a tapasztalatokat, így minél többet használják, annál jobban érti a felhasználót

Mivel ez egy kísérleti, élvonalbeli fejlesztés, a stabilitás, az energiafogyasztás és az összetett helyzetekben elért végrehajtási sikeresség még folyamatos optimalizálás alatt áll. Egyes nagy bonyolultságú feladatoknál előfordulhat, hogy a végrehajtás hatékonysága ingadozik, vagy időszakosan sikertelen. A mostani zárt teszt nem nyilvános jelentkezéssel történik, hanem meghívásos alapon. Ismét fontos kiemelni, hogy a frissítés nem ajánlott mindennapi fő eszközön. Inkább technológiai rajongóknak és intenzív AI-felhasználóknak javasolt, előzetes adatmentéssel és ellenőrzött környezetben történő kipróbálással

01 Rendszeralap képességek: amikor az AI valóban cselekedni tud

Miért alapfeltétel a rendszeridentitás
A Xiaomi miclaw rendszeralkalmazásként fut, és rendelkezik a rendszer alapalkalmazásainak képességeivel

Az alkalmazás sandboxában futó AI, bármilyen erős modellre is épül, leginkább kérdések megválaszolására és internetes keresésre képes. A rendszerszintű AI viszont más, mert rendszerszintű vezérlést is tud biztosítani

50+ rendszerszintű eszköz

A Xiaomi miclaw a telefon rendszerképességeit több mint 50 rendszerfunkcióba és ökoszisztéma-szolgáltatásba csomagolja (a lista folyamatosan bővül)

Minden eszköz strukturált paramétereket kap, és végrehajtási eredményt ad vissza. Az elérhető eszközök attól függnek, hogy a felhasználó milyen engedélyeket adott

Nagy modellre épülő következtetés-végrehajtás motor
Az eszközök önmagukban nem elegendők. A kulcs az, hogy a modell maga döntse el a hívások sorrendjét. A Xiaomi miclaw központi motorja egy következtetés-végrehajtás ciklus

Felhasználói bevitel → modell következtetés (eszköz kiválasztása, paraméterek meghatározása) → eszköz végrehajtás → eredmény visszaküldése → modell újabb következtetés → … → feladat befejezése, válasz

A modell minden lépésnél maga dönt arról, melyik eszközt hívja meg, milyen paraméterekkel, és hogy a feladat elkészült-e. Az eszközök végrehajtását külön időkorlát védi, az egész rendszer aszinkron architektúrán fut, így nem blokkolja a rendszerfolyamatokat

Az alsó réteg egységes absztrakciót biztosít a főbb nagy modell protokollokhoz, így modellcsere esetén nem kell módosítani a felső logikát. A felhasználói oldalon az élmény folyamatos frissítésként jelenik meg: látható, melyik eszközt hívja az AI és melyik lépésnél tart

Kontextuskezelés: több körös párbeszédnél sem vész el a lényeg
A hosszú beszélgetések nem szakadnak meg, több eszközhívásnál a legnagyobb gond, ha „közben elfelejtődik a kiinduló cél”. A Xiaomi miclaw háromszintű intelligens memóriakezelést használ: automatikusan megőrzi a fontos döntési pontokat, dinamikusan tömöríti a felesleges interakciókat, a kulcsutasításokat pedig helyi gyorsítótárban optimalizálja. Még 20 egymást követő, összetett műveletnél is emlékszik az eredeti igényre, így nincs szükség ismételt magyarázatra, a szolgáltatás végig következetes marad

Fordulótömörítés: a régi beszélgetések összetömörítése, a legutóbbi interakciók kiemelésével
Token tömörítés: a kontextusablak felső határához közeledve intelligens tömörítés üzenetszinten

A rendszer promptjai többszintű kialakítást kapnak, és a dinamikus információk az első felhasználói üzenetbe kerülnek be. Így a prompt egy része a modell gyorsítótárába kerülhet, ami a mérések szerint 50-90% tokenhasználat-csökkenést eredményez

02 Személyes kontextus: amikor az AI valóban érti a felhasználót

A „mit mondtál” szintről a „hogyan élsz” szintre
A hagyományos AI-asszisztenseknek kevés kontextus áll rendelkezésükre, általában csak az aktuális üzenetre figyelnek. A Xiaomi miclaw felhasználói engedéllyel a használati szokások alapján nyújt szolgáltatást

„Érzékelés → kapcsolás → döntés → cselekvés”
A hagyományos alkalmazások csak „érzékelés → cselekvés” módon működnek: érkezik egy értesítés, megjelenik az értesítés. A Xiaomi miclaw két lépést iktat közéjük, a kapcsolást és a döntést. Ez az AI Agent és a hagyományos szoftver közötti határ

Példa: utazás előkészítése
Értesítés érkezik: „Jegyvásárlás sikeres G1234 Peking → Csengtu péntek 08:30”. Ezután a következő történik

7 lépés automatikusan lefut, 6 külön eszköz összekapcsolásával. A modell következtetési képessége fontos, de az alapfeltétel az, hogy az AI hozzáférjen az SMS-ekhez és a naptárhoz



Példa: fogyasztási elemzés
Banki terhelésről szóló SMS → AI elolvassa az elmúlt 3 hónap üzeneteit → felismeri, hogy két videóplatform egyszerre von havidíjat → tartalmi átfedést állapít meg → hónap végén fogyasztási jelentést küld, és javasolja az egyik előfizetés lemondását, amivel évente közel 400 jüan takarítható meg

Adatbiztonság
Az adatkezelés alapelve: a beszélgetési előzmények, a felhasználói beállítások és a képességfájlok mind helyben, az eszközön tárolódnak. A felhőbe csak az aktuális beszélgetés üzenete kerül következtetés céljából, titkosított adatátvitellel, így biztosított a felhasználói adatok védelme. Az érzékeny műveleteket végző eszközök (például SMS küldése vagy esemény létrehozása) minden végrehajtás előtt megerősítést kérnek

03 Ökoszisztéma-kapcsolódás: a telefontól az egész okos életig

Amikor az AI az otthoni eszközöket is irányítja
Az előző két rész a telefonról szólt. A harmadik szint kiterjeszti az AI „kezét” a telefonon túlra, és csatlakozik a Xiaomi IoT ökoszisztémához

A Mi Home platform több mint 1 milliárd eszközt kapcsol össze. A Xiaomi miclaw teljes Mi Home protokoll klienssel rendelkezik, képes olvasni az eszközállapotokat és vezérlési parancsokat küldeni. Felhasználói engedéllyel elméletileg minden Mi Home-hoz csatlakoztatott IoT eszközt irányítani tud

A protokoll kliens egyik kulcsfeladata a „fordítás”. Az IoT eszközök képességeit általában gép által olvasható specifikációk írják le (paramétertípusok, értéktartományok, korlátozások). A Xiaomi miclaw ezt természetes nyelvű paraméterleírássá alakítja a nagy modell számára. A modell így például ilyen leírást lát: „kapcsold be a nappali klímát, paraméter: kapcsoló (be/ki)”

Példa: otthoni munkamód
Naptáresemény „10:00 fontos ügyféltalálkozó” → az AI csendes környezetet feltételez

a telefon automatikusan némít
a robotporszívó leáll
a bejövő hívásokat fontosság szerint kezeli: főnök hívásakor rezgés, futár hívása csak rögzítésre kerül
a meeting után minden eszköz visszaáll az eredeti állapotba, és összefoglaló érkezik a nem fogadott hívásokról és üzenetekről

A hagyományos okosotthon előre beállított szabályokra épül. A Xiaomi miclaw viszont a pillanatnyi kontextus alapján dönt. Ugyanaz a „meeting” más reakciót válthat ki: egy belső heti értekezletnél talán csak a telefon némul el, míg egy fontos ügyféltalálkozónál az egész lakás eszközei reagálnak. A döntés alapja lehet a naptár leírása, a korábbi szokások és az aktuális eszközállapot

Nyílt protokollos bővítés
Az ökoszisztéma nem áll meg a Xiaomi saját eszközeinél. Két nyílt csatorna teszi lehetővé a harmadik felek csatlakozását

MCP (Model Context Protocol): nyílt szabvány az AI eszközintegrációhoz. A Xiaomi miclaw teljes MCP klienssel rendelkezik, támogatja a szabványos kommunikációt, a folyamatos válaszokat és az aszinkron szolgáltatásfelderítést. A PC-n már létező több ezer MCP eszköz elméletileg közvetlenül csatlakoztatható a telefon AI-jához

Nyílt SDK: a Xiaomi miclaw harmadik fél alkalmazásai számára is elérhető SDK-t ad ki. A biztonságot aláírási szintű jogosultságvédelem biztosítja. Az alkalmazások maguk jelzik, milyen eszközképességeket tudnak biztosítani, a Xiaomi miclaw pedig dinamikusan fedezi fel és hívja őket. A logika megfordul: az alkalmazás közli az AI-val, mire képes, az AI pedig szükség szerint használja

04 Önfejlődés: az AI képességeinek folyamatos bővülése

Az eddigi három szint a Xiaomi miclaw alapértelmezett képessége. Van azonban egy még fontosabb tulajdonság: amit képes megtenni, az nincs előre rögzítve

A Xiaomi miclaw meta képessége röviden „eszközöket létrehozó eszköz”

Fájlszintű memória → tetszőleges adatstruktúra létrehozása. Az AI ezzel a képességgel maga tervezte meg a memóriarendszerét: memóriamappák létrehozása, tárolási formátumok meghatározása, lekérési szabályok írása. Minél többet használják, annál jobban ismeri a preferenciákat, a gyakori kontaktokat és a korábbi feladatokat

Alügynökök létrehozása → specializált feladatmegosztás. Minden alügynök külön prompttal és eszközlistával rendelkezik, sandbox környezetben működik. Lehet külön naptárkezelő alügynök vagy információ-összefoglaló alügynök

MCP szolgáltatás konfigurálása → külső képességek dinamikus csatlakoztatása, a használható eszközök folyamatos bővítése

Szkriptfuttatás → Python vagy JavaScript futtatása sandbox környezetben, általános programozási képességgel

Ez a négy képesség együtt ad fejlődési pályát: először a saját működését módosítja (promptok és fájlok), majd bővíti a képességeit (alügynökök és MCP kapcsolatok), végül a memóriarendszerben rögzíti a tapasztalatokat, így egyre jobban alkalmazkodik

Ezeket a folyamatokat senki sem írta meg előre. Az AI az alap eszközökből maga épített magasabb szintű használati módokat

Végszó
A rendszerszintű képességek teszik lehetővé a cselekvést, a személyes kontextus az értést, az ökoszisztéma-kapcsolódás pedig a telefonon túli irányítást. Az önfejlődés pedig mindezt folyamatosan erősíti

Amikor a nagy modellek valóban a telefon rendszerébe épülnek, maga a telefon az AI testének részévé válik

 

Forrás 1, forrás 2

István

István Szerző

A szerző informatikai végzettségű és imádja a tech világát – napi szinten több száz hírt néz át, értékel ki és évek óta tesztel különféle eszközöket, kütyüket, időnként appokat és szolgáltatásokat. Több ezer terméken van már túl, így van némi rálátása arra, mi az, ami tényleg megéri, és mi az, amit jobb elkerülni. Kapcsolat: istvan@tesztarena.hu

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöljük.