Hikvision Videoüberwachung mit Deep Learning

Überwachungskameras und Rekorder mit Deep Learning Technologie von Hikvision

Mit den Produkten aus den neuen Serien DeepinMind und DeepinView bringt Hikvision das Deep Learning in die Videoüberwachung. Die neuartigen Algorithmen in Überwachungskameras und Netzwerkvideorekordern ermöglichen Analysen auf einem unerreichten Niveau: Fehlalarme werden signifikant reduziert, Arbeitszeit gespart und Kosten gesenkt, während das Sicherheitsniveau steigt und die Anwendungsmöglichkeiten wachsen.

Deep Learning liefert bessere Ergebnisse

Als übergeordnetes Konzept spielt Deep Learning in vielen Lebensbereichen eine immer wichtigere Rolle. Überall, wo es auf eine komfortable, schnelle und fehlerfreie Automatisierung der Datenanalyse ankommt, arbeiten im Hintergrund Deep Learning Algorithmen und künstliche neuronale Netze. Prominentestes Beispiel sind intelligente Sprachassistenten in Smartphones und Smart Home Steuerungen, wie sie Verbraucher durch Siri und Alexa kennen.

Auch die Vision des vollständig autonomen Autofahrens basiert auf Deep Learning. Dieses Beispiel verdeutlicht eindringlich, wie wichtig die korrekte Analyse von großen Datenmengen binnen kürzester Zeit ist. Ein Stoppschild muss immer und nicht nur oft richtig erkannt werden, ein unerwartet ausscherendes Fahrzeug darf niemals übersehen werden usw. Um dieses hohe Niveau zu erreichen, ist Deep Learning die Schlüsseltechnologie, die im Bereich der Sicherheitstechnik dank Hikvision nun ebenfalls zum Einsatz kommt.

Künstliche neuronale Netze lernen dazu

Mit dem Begriff Deep Learning wird in der Regel eine Kombination bezeichnet. Sehr leistungsstarke Grafikprozessoren (GPUs) arbeiten zusammen mit künstlichen neuronalen Netzwerken, um Ordnung in eine sehr große Datenmenge (Big Data) zu bringen. Im Fall der Videoüberwachung trifft eine sehr große Menge an Bilddaten auf das neuronale Netz. Das Netz muss nun nicht nur grob unterschieden zwischen Tieren, Menschen und Fahrzeugen, sondern auch zwischen verschiedenen Individuen der einzelnen Gruppen bis hin zur Unterscheidung einzelner Gesichter. Die künstliche Intelligenz darf sich nicht täuschen lassen. Frisuren, Make-up, Brillen oder Hüte, kurz: Abweichungen von bekannten Mustern dürfen nicht zu Fehlern führen.

Erreicht wird die hohe Trefferquote, indem das künstliche Netz Arbeitsweise und Aufbau des natürlichen Neuronennetzes imitiert, wie es im menschlichen Gehirn vorliegt. Künstliche Netzwerke bestehen aus mehreren, bis weit über 100 hierarchisch angeordneten Schichten von Software-Neuronen, die untereinander verbunden sind. Im Ursprungszustand sind alle Verbindungen gleich stark, fast wie beim Gehirn eines Neugeborenen. Das künstliche Netz wird trainiert, indem ihm Millionen von Bilddaten zur Analyse vorgelegt werden. Der Unterschied des Deep Learning zu anderen Arten des maschinellen Lernens besteht darin, dass das neuronale Netz die Merkmale, nach denen es Ordnung erstellt, selbst entwirft. Je mehr Daten das Netz analysiert, desto besser werden die Ordnungskriterien und folglich die Ergebnisse.

Dabei verändert sich das Netz: Manche Verbindungen zwischen den Neuronen der einzelnen Ebenen werden im Laufe der Zeit immer stärker gewichtet, andere immer schwächer oder ganz gekappt. Auch darin ahmt die Technik die Biologie nach. Man kann den Vergleich mit dem Neugeborenen sehr genau nehmen. Dem Säuglingsgehirn sagt niemand, dass die sensorischen Daten, die es empfängt (durch Augen, Ohren, …), in einen geordneten Zusammenhang gebracht werden können und worin dieser Zusammenhang besteht. Das Gehirn entwirft die Ordnungsschemata selbstständig – und so macht es auch das künstliche neuronale Netz. Dadurch erreicht es viel bessere Ergebnisse, als wenn es nur Regeln folgen würde, die Menschen vorgeben. Die abstrakten Zusammenhänge zur Klassifikation, die ein künstliches neuronales Netz verwendet, sind teilweise nicht von Programmierern beschreibbar.

Deep Learning in der Videoüberwachung

Die Grundvoraussetzung für die Anwendung von Deep Learning in der Videoüberwachung bilden die riesigen Mengen an hochauflösenden Videodaten, wie sie erst seit einigen Jahren mit HD Überwachungskameras möglich sind. Ohne diese unüberschaubare Anzahl an Datensätzen könnte das künstliche Netz nicht trainiert werden. Außerdem müssen diese Datenmengen zu bezahlbaren Preisen auf kleinem Raum analysiert werden. Hierzu kooperiert Hikvision mit den Marktführern der Chiphersteller nVidia und Intel. In den kleinen Gehäusen der DeepinMind Netzwerkvideorekorder und der DeepinView Kameras leisten Chips Rechenarbeit, für die früher Lagerhallen voller Rechner nötig gewesen wären.

In der Praxis lassen sich herkömmliche NVRs einfach gegen ein neues Modell mit Deep Learning austauschen, um Anwendern einen unkomplizierten und schrittweisen Umstieg auf die neue Technologie zu ermöglichen. Allein dadurch reduzieren sich Fehlalarme um 90 %, auch bei schlechten Lichtverhältnissen und umfangreichen Analyseaufgaben. DeepinMind NVRs erlauben neben der verbesserten Liveüberwachung ebenfalls das blitzschnelle Durchsuchen gespeicherter Aufnahmen nach einer bestimmten Person. Dazu lädt man einfach ein Porträt in den NVR, der das Bild analysiert und alle Treffer mit Aufnahmezeit auflistet. Als Zulieferer der Daten kann jede smarte IP Überwachungskamera dienen.

Auch ohne einen DeepinMind Rekorder erkennt eine Deep Learning Kamera schon selbstständig relevante Ziele, verfolgt sie und nimmt sie auf. Die besten Ergebnisse erzielt die Kombination aus Deep Learning Kameras und NVRs. Dabei spielen nicht nur die klassischen intelligenten Videoanalysen wie die Erkennung von Gesichtern und Eindringlingen auf höchstem Niveau. Denkbar sind auch ganz neue Anwendungsbereiche, z. B. in der Pflege: Eine hilfebedürftige Person, die gestürzt ist, kann bald schon anhand einer genauen Bildanalyse erkannt werden. Die Bereiche und der Umfang, in denen Videoüberwachung mit Deep Learning die Welt verändert, sind noch nicht abschließend abzuschätzen.