aae14b952b0c86af8abddffed0a7b071 XPENG-Peking University Collaborative Research Accepted by AAAI 2026: Introducing a Novel Visual Token Pruning Framework for Autonomous Driving
  • XPENG-PKU-Forschungsdurchbruch: XPENG hat in Zusammenarbeit mit der Peking University FastDriveVLA entwickelt – ein neuartiges Framework zur Reduzierung visueller Tokens, das es KI für autonomes Fahren ermöglicht, „wie ein Mensch zu fahren“, indem sie sich nur auf wesentliche Informationen konzentriert und so eine 7,5-fache Reduzierung der Rechenlast erreicht.
  • Spitzen-Anerkennung im KI-Bereich: Die Forschung wurde von der AAAI 2026 angenommen, einer der weltweit führenden KI-Konferenzen, die dieses Jahr eine äußerst selektive Annahmequote von nur 17,6 % hatte.
  • Beschleunigung der L4-Autonomie: Dieser Erfolg unterstreicht die Full-Stack-Fähigkeiten von XPENG in der KI-gesteuerten Mobilität und treibt die Branche in Richtung einer effizienten, skalierbaren Bereitstellung von autonomen Fahrzeugen der nächsten Generation voran.

(SeaPRwire) –   GUANGZHOU, China, 28. Dez. 2025 — XPENG hat in Zusammenarbeit mit der Peking University seine Arbeit mit dem Titel „FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning“ von der AAAI 2026 annehmen lassen, einer der weltweit führenden Konferenzen für künstliche Intelligenz. Die AAAI 2026 erhielt 23.680 Einreichungen, von denen nur 4.167 Arbeiten angenommen wurden, was einer Annahmequote von nur 17,6 % entspricht.

Die Arbeit stellt FastDriveVLA vor, ein effizientes Framework zur Reduzierung visueller Tokens, das speziell für End-to-End-Vision-Language-Action (VLA)-Modelle für autonomes Fahren entwickelt wurde. Diese Arbeit bietet einen neuen Ansatz zur Reduzierung visueller Tokens, indem sie der KI ermöglicht, „wie ein Mensch zu fahren“, sich also nur auf wesentliche visuelle Informationen zu konzentrieren und irrelevante Daten herauszufiltern.

Da sich große KI-Modelle rasant weiterentwickeln, werden VLA-Modelle aufgrund ihrer starken Fähigkeiten im Verständnis komplexer Szenen und in der Handlungsableitung häufig in End-to-End-Systemen für autonomes Fahren eingesetzt. Diese Modelle kodieren Bilder in eine große Anzahl visueller Tokens, die als Grundlage dafür dienen, dass das Modell die Welt „sieht“ und Fahrentscheidungen trifft. Die Verarbeitung einer großen Anzahl von Tokens erhöht jedoch die Rechenlast im Fahrzeug, was die Inferenzgeschwindigkeit und die Echtzeitleistung beeinträchtigt.

Obwohl die Reduzierung visueller Tokens als praktikable Methode zur Beschleunigung der VLA-Inferenz anerkannt ist, haben bestehende Ansätze, ob auf Text-Bild-Aufmerksamkeit oder Token-Ähnlichkeit basierend, in Fahrszenarien Einschränkungen gezeigt. Um dieses Problem zu lösen, entwickelten XPENG und die PKU FastDriveVLA, ein neuartiges, rekonstruktionsbasiertes Framework zur Token-Reduzierung, das davon inspiriert ist, wie menschliche Fahrer sich auf relevante Vordergrundinformationen konzentrieren, während sie nicht-kritische Hintergrundbereiche ignorieren.

Die Methode führt eine adversariale Vordergrund-Hintergrund-Rekonstruktionsstrategie ein, die die Fähigkeit des Modells verbessert, wertvolle Tokens zu identifizieren und zu behalten. Beim nuScenes-Benchmark für autonomes Fahren erzielte FastDriveVLA state-of-the-art Leistungen über verschiedene Reduktionsverhältnisse hinweg. Wenn die Anzahl der visuellen Tokens von 3.249 auf 812 reduziert wurde, erreichte das Framework eine nahezu 7,5-fache Verringerung der Rechenlast bei gleichbleibend hoher Planungsgenauigkeit.

Dies ist das zweite Mal in diesem Jahr, dass XPENG auf einer globalen KI-Spitzenkonferenz Anerkennung fand. Im Juni war XPENG der einzige chinesische Autohersteller, der eingeladen wurde, auf der CVPR WAD zu sprechen, wo es Fortschritte bei Foundation Models für autonomes Fahren vorstellte. An seinem AI Day im November enthüllte XPENG die VLA 2.0-Architektur, die den Schritt der „Sprachübersetzung“ entfernt und eine direkte Visual-to-Action-Generierung ermöglicht – ein Durchbruch, der die konventionelle V-L-A-Pipeline neu definiert.

Diese Errungenschaften spiegeln die internen Full-Stack-Fähigkeiten von XPENG wider, vom Modellarchitektur-Design und Training über die Destillation bis hin zur Fahrzeugbereitstellung. In Zukunft bleibt XPENG dem Erreichen von autonomem Fahren der Stufe L4 verpflichtet, um die Integration physischer KI-Systeme in Fahrzeuge zu beschleunigen, mit dem Ziel, Nutzern auf der ganzen Welt sichere, effiziente und komfortable intelligente Fahrerlebnisse zu bieten.

Über XPENG
XPENG hat sich der Führung bei der Transformation der zukünftigen Mobilität durch technologische Erkundung verschrieben und positioniert sich als „Explorer of Future Mobility“. Mit Hauptsitz in Guangzhou, China, betreibt das Unternehmen F&E-Zentren in Beijing, Shanghai, Shenzhen, Zhaoqing und Yangzhou und hat intelligente Fertigungsstätten in Zhaoqing und Guangzhou eingerichtet.

XPENG verfolgt eine globale Strategie für Forschung, Entwicklung und Vertrieb, mit einem F&E-Zentrum in den USA und Tochtergesellschaften in mehreren europäischen Ländern. Das Unternehmen hält an der internen Full-Stack-Entwicklung intelligenter Fahrerassistenzsoftware und der Entwicklung von Kernhardware fest und bietet den Nutzern ein herausragendes intelligentes Fahr- und Reiseerlebnis.

Am 27. August 2020 wurde XPENG offiziell an der New York Stock Exchange (NYSE: XPEV) gelistet und sammelte mit einem Börsengang Mittel, der zu diesem Zeitpunkt einen Rekord in der globalen Neuenergiefahrzeugindustrie aufstellte. Am 7. Juli 2021 wurde das Unternehmen an der Hong Kong Stock Exchange (HKEX: 9868) gelistet und wurde damit der erste chinesische Neuenergie-Autohersteller, der eine primäre Doppellistierung sowohl in Hongkong als auch in New York erreichte.

Für weitere Informationen besuchen Sie bitte .

Kontakte:
Für Medienanfragen: Alison Liang, XPENG PR Department
E-Mail:  

QUELLE XPENG

Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.

Branchen: Top-Story, Tagesnachrichten

SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen.