Jemný Úvod do Hluboké Učení pro Rozpoznávání Tváří,

Tweet share Podělte

Naposledy Aktualizován dne 5. července 2019

rozpoznávání Obličeje je problém identifikace a ověřování lidí ve fotografii tím, že jejich tvář.

To je úkol, který je triviálně provádí lidé, dokonce i za různých světelných a když tváře se mění podle věku nebo ucpaný s příslušenstvím a vousy. Nicméně, to je zůstal náročný problém počítačového vidění po celá desetiletí až do nedávné doby.

metody hlubokého učení jsou schopny využít velmi velké datové soubory tváří a naučit se bohaté a kompaktní reprezentace tváří, což umožňuje moderním modelům nejprve provádět stejně dobře a později překonat schopnosti rozpoznávání obličeje lidí.

v tomto příspěvku objevíte problém rozpoznávání obličeje a jak metody hlubokého učení mohou dosáhnout nadlidského výkonu.

po přečtení tohoto příspěvku budete vědět:

  • rozpoznávání obličeje je široký problém identifikace nebo ověřování lidí na fotografiích a videích.
  • rozpoznávání Tváře je proces, skládá se z detekce, zarovnání, funkce extrakce a rozpoznávání úkol
  • Hluboké učení modely poprvé oslovil poté překročil lidské výkonnosti pro rozpoznávání obličeje úkoly.

nastartujte svůj projekt s mou novou knihou hluboké učení pro počítačové vidění, včetně podrobných tutoriálů a souborů zdrojového kódu Pythonu pro všechny příklady.

začněme.

Jemný Úvod do Hluboké Učení pro Rozpoznávání Tváří,

Jemný Úvod do Hluboké Učení pro Rozpoznávání Tváří,
Foto Susanne Nilsson, některá práva jsou vyhrazena.

přehled

Tento výukový program je rozdělen do pěti částí; jsou:

  1. Tváře na Fotografiích
  2. Proces Automatického Rozpoznání Obličeje
  3. Detekce Obličeje Úkol
  4. Rozpoznání Obličeje Úkoly
  5. Hluboké Učení pro Rozpoznávání Tváří,

Tváře na Fotografiích

Tam je často nutné, aby se automaticky rozpozná lidi na fotografii.

existuje mnoho důvodů, proč bychom mohli chtít automaticky rozpoznat osobu na fotografii.

například:

  • můžeme omezit přístup ke zdroji na jednu osobu, tzv.
  • můžeme potvrdit, že osoba odpovídá jejich ID, tzv.
  • Možná budeme chtít přiřadit jméno k obličeji, zvané identifikace obličeje.

obecně to označujeme jako problém automatického „rozpoznávání obličeje“ a může se vztahovat jak na statické fotografie, tak na tváře v streamech videa.

lidé mohou tento úkol provádět velmi snadno.

můžeme najít tváře na obrázku a komentovat, kdo jsou lidé, pokud jsou známí. Můžeme to udělat velmi dobře, jako když lidé ve věku, nosí brýle, mají různé barevné vlasy, hledají v různých směrech, a tak dále. Můžeme to udělat tak dobře, že najdeme tváře tam, kde žádné nejsou, například v oblacích.

nicméně, to zůstává těžký problém provádět automaticky se softwarem, a to i po 60 nebo více let výzkumu. Až možná velmi nedávno.

například, rozpoznání tváří snímky pořízené ve venkovním prostředí, změny v osvětlení a/nebo představují zůstává z velké části nevyřešený problém. Jinými slovy, současné systémy jsou stále daleko od schopnosti systému lidského vnímání.

— – rozpoznávání tváří: průzkum literatury, 2003.

chcete výsledky s hlubokým učením pro počítačové vidění?

Vezměte si zdarma 7denní e-mailový rychlokurz (se vzorovým kódem).

kliknutím se zaregistrujete a také získáte zdarma PDF Ebook verzi kurzu.

Stáhněte si ZDARMA Mini-Kurz,

Proces Automatického Rozpoznání Obličeje

rozpoznávání Obličeje je problém identifikace nebo ověření tváře na fotografii.

obecné prohlášení o problému strojového rozpoznávání obličejů může být formulována takto: vzhledem k tomu, stále nebo video obrazy, scény, identifikovat nebo ověřit jednu nebo více osob, které ve scéně pomocí uložené databáze obličejů

— Face Recognition: Průzkum Literatury, 2003.

rozpoznávání obličeje je často popisováno jako proces, který nejprve zahrnuje čtyři kroky; jsou to: detekce obličeje, zarovnání obličeje, extrakce funkcí a nakonec rozpoznávání obličeje.

  1. detekce obličeje. Vyhledejte jednu nebo více ploch na obrázku a označte ohraničujícím rámečkem.
  2. zarovnání obličeje. Normalizujte obličej tak, aby byl v souladu s databází, jako je geometrie a fotometrie.
  3. extrakce funkce. Extrahujte funkce z obličeje, které lze použít pro rozpoznávací úlohu.
  4. rozpoznávání obličeje. Proveďte shodu obličeje s jednou nebo více známými tvářemi v připravené databázi.

daný systém může mít samostatný modul nebo program pro každý krok, který byl tradičně případě, nebo se mohou spojit některé nebo všechny kroky do jednoho procesu.

užitečný přehled tohoto procesu je uveden v knize „Příručka pro Rozpoznávání Obličeje,“ uvedených níže:

Přehled Kroků na Proces Rozpoznávání obličejů

Přehled Kroků na Proces Rozpoznávání obličejů. Převzato z“ Handbook of Face Recognition“, 2011.

úkol detekce obličeje

detekce obličeje je netriviální první krok v rozpoznávání obličeje.

je to problém rozpoznávání objektů, který vyžaduje, aby bylo identifikováno jak umístění každé tváře na fotografii (např. Poloha), tak rozsah obličeje je lokalizován (např. ohraničujícím rámečkem). Rozpoznávání objektů samo o sobě je náročný problém, i když v tomto případě je to podobné, protože existuje pouze jeden typ objektu, např. tváře, které mají být lokalizovány, i když tváře se mohou divoce lišit.

lidský obličej je dynamický objekt a má vysoký stupeň variability v jeho vzhledu, který dělá detekce obličeje obtížný problém v počítačovém vidění.

— – detekce obličeje: průzkum, 2001.

dále, protože se jedná o první krok v širším systému rozpoznávání obličeje, musí být detekce obličeje robustní. Například obličej nelze rozpoznat, pokud jej nelze nejprve detekovat. To znamená, že tváře musí být detekovány se všemi druhy orientací, úhly, úrovně světla, účesy, klobouky, brýle, vousy, make-up, věky a tak dále.

Jako vizuální front-end procesor, detekce tváře, systém by měl být také schopen dosáhnout úkol bez ohledu na to, osvětlení, orientace a vzdálenost kamery

— Detekce Obličeje: Průzkum, 2001.

V roce 2001 článek s názvem „Detekce Obličeje: Průzkum“ poskytuje taxonomie detekce obličeje metod, které lze rozdělit do dvou hlavních skupin:

  • Funkce-Založené.
  • založené na obrázcích.

funkce na bázi detekce obličeje používá ručně vytvořený filtry, které hledat a najít tváře na fotografiích založených na hluboké znalosti domény. Mohou být velmi rychlé a velmi účinné, když se filtry shodují, i když mohou dramaticky selhat, když ne, např.

… explicitně využívat znalosti tváře a řídit se klasickou detekční metodikou, ve které jsou vlastnosti nízké úrovně odvozeny před analýzou založenou na znalostech. Zjevné vlastnosti obličeje, jako je barva pleti a geometrie obličeje, jsou využívány na různých úrovních systému.

— – detekce obličeje: průzkum, 2001.

alternativně je detekce obličeje založená na obrazu holistická a učí se, jak automaticky lokalizovat a extrahovat tváře z celého obrazu. Neuronové sítě zapadají do této třídy metod.

… adresa detekce obličeje jako obecný problém rozpoznávání. Obrazové reprezentace obličejů, například v polích intenzity 2D, jsou přímo klasifikovány do skupiny tváří pomocí tréninkových algoritmů bez odvození a analýzy funkcí. tyto relativně nové techniky implicitně začleňují znalosti obličeje do systému prostřednictvím mapovacích a výcvikových schémat.

— – detekce obličeje: průzkum, 2001.

možná dominantní metoda detekce obličeje používaná po mnoho let (a byla použita v mnoha kamerách) byla popsána v roce 2004 s názvem „robustní detekce objektů v reálném čase“, nazývaná kaskáda detektoru nebo jednoduše „kaskáda“.“

Jejich detektor, nazývá detektor kaskády, skládá se ze sekvence jednoduché-to-komplex tvář klasifikátory a přilákal rozsáhlé výzkumné úsilí. Detektorová kaskáda byla navíc nasazena v mnoha komerčních produktech, jako jsou smartphony a digitální fotoaparáty. Zatímco kaskádové detektory mohou přesně najít viditelné svislé plochy, často nedokážou detekovat tváře z různých úhlů, např. boční pohled nebo částečně uzavřené plochy.

— Multi-view Detekce Obličeje Pomocí Hluboké Konvoluční Neuronové Sítě, 2015.

Pro návod na hluboké učení pro detekci obličeje viz:

  • Jak Provést Detekce Obličeje s Hlubokými Učení v Keras

Rozpoznávání Obličeje Úkoly

úkol rozpoznávání obličeje je široká a může být šité na míru specifickým potřebám předpověď problém.

například, v roce 1995 knihu s názvem „Lidské a strojové rozpoznávání obličejů: průzkum,“ autoři popisují tři rozpoznávání obličeje úkoly:

  • na Obličej Matching: Najít nejlepší zápas pro daný obličej.
  • podobnost obličeje: Najděte tváře, které jsou nejvíce podobné dané tváři.
  • transformace obličeje: Vygenerujte nové tváře, které jsou podobné dané tváři.

shrnují tyto tři samostatné úkoly takto:

shoda vyžaduje, aby kandidát odpovídající obrázek obličeje byl v nějaké sadě obrázků obličeje vybraných systémem. Podobnost detekce vyžaduje kromě odpovídající, že obrazy tváří se nacházejí, které jsou podobné třeba připomenout, face to vyžaduje, že podobnost měření používá systém rozpoznávání úzce odpovídat podobnosti používané lidmi Transformace aplikací, které vyžadují nové obrázky vytvořený systém podobný lidské vzpomínky tvář.

— – lidské a strojové rozpoznávání tváří: průzkum, 1995.

kniha o rozpoznávání obličeje z roku 2011 s názvem „Handbook of Face Recognition“ popisuje dva hlavní způsoby rozpoznávání obličeje, jako:

  • ověření obličeje. Individuální mapování dané tváře proti známé identitě (např.).
  • identifikace obličeje. Individuální mapování pro danou tvář proti databázi známých tváří (např. kdo je tato osoba?).

očekává se, že systém rozpoznávání obličeje automaticky identifikuje tváře přítomné v obrázcích a videích. Může pracovat v jednom nebo obou dvou režimech: (1) ověření obličeje (nebo ověření) a (2) identifikace obličeje (nebo rozpoznávání).

— – strana 1, příručka rozpoznávání obličeje. 2011.

problém rozpoznávání obličeje můžeme popsat jako supervizovanou úlohu prediktivního modelování vyškolenou na vzorcích se vstupy a výstupy.

V všechny úkoly, vstup je fotografie, která obsahuje alespoň jednu tvář, s největší pravděpodobností detekován obličej, které mohou také byly vyrovnány.

výstup se liší v závislosti na typu predikce požadované pro úlohu; například:

  • může to být označení binární třídy nebo pravděpodobnost binární třídy v případě úlohy ověření tváře.
  • může to být kategorický štítek třídy nebo sada pravděpodobností pro úkol identifikace obličeje.
  • může to být metrika podobnosti v případě úlohy typu podobnosti.

hluboké učení pro rozpoznávání obličeje

rozpoznávání obličeje zůstalo aktivní oblastí výzkumu počítačového vidění.

možná jedna z více známých a přijatých metod „strojového učení“ pro rozpoznávání obličeje byla popsána v dokumentu z roku 1991 s názvem “ rozpoznávání obličeje pomocí vlastních tváří.“Jejich metoda, nazývaná jednoduše“ Eigenfaces“, byla milníkem, protože dosáhla působivých výsledků a prokázala schopnost jednoduchých holistických přístupů.

snímky obličeje jsou promítány do prostoru („face space“), který nejlépe kóduje variaci mezi známými obrázky obličeje. Obličej prostor je definován „eigenfaces“, což jsou vlastní vektory z množiny tváře; nemusí nutně odpovídat izolované rysy, jako jsou oči, uši a nosy.

— Rozpoznávání Obličeje Pomocí Eigenfaces, 1991.

V roce 2018 dokumentu s názvem „Deep Face Recognition: Průzkum,“ poskytuje užitečný přehled o stavu rozpoznávání obličeje výzkum za posledních téměř 30 let, s důrazem na široký trend z holistické metody učení (jako je Eigenfaces), místní ručně detekce funkce, mělké metody učení, aby konečně hluboké učení, metody, které jsou v současné době nejmodernější.

holistické přístupy dominovaly komunitě rozpoznávání obličeje v 90.letech. V časném 2000s, handcrafted lokální deskriptory stal se populární, a místní funkce učení byly zavedeny v pozdní 2000s. výkon neustále zlepšuje přibližně od 60% do výše 90%, zatímco hluboké učení zvyšuje výkon, aby 99.80% za pouhé tři roky.

— – hluboké rozpoznávání obličeje: průzkum, 2018.

Vzhledem k tomu průlom AlexNet v roce 2012 pro jednodušší problém klasifikace obrazu, tam byl příval výzkum a publikace v roce 2014 a 2015 na hluboké učení metody pro rozpoznávání obličejů. Schopnosti rychle dosáhnout téměř lidské úrovně výkonu, pak překročil lidské úrovni výkonu na standardní rozpoznávání obličeje dataset v rámci tříletého období, které je ohromující míra zlepšení vzhledem k předchozím desetiletí úsilí.

Tam jsou snad čtyři milestone systems na hluboké učení pro rozpoznávání tváří, který jel tyto inovace; jsou to: DeepFace, DeepID řada systémů, VGGFace, a FaceNet. Pojďme se krátce dotknout každého.

DeepFace je systém založený na hlubokých konvolučních neuronových sítích popsaných Yanivem Taigmanem a kol. z Facebook AI Research a Tel Aviv. Byl popsán v roce 2014 s názvem „DeepFace: Closing the Gap to Human-Level Performance in Face Verification.“Byl to možná první velký skok vpřed s využitím hlubokého učení pro rozpoznávání obličeje a dosažením výkonu na úrovni člověka na standardním srovnávacím souboru.

Naše metoda dosahuje přesnosti 97.35% na Označené Plochy v Přírodě (LFW) údajů, čímž se snižuje chyba současný stav o více než 27%, těsně blíží lidské úrovni výkonu.

— – DeepFace: Closing the Gap to Human-Level Performance in Face Verification, 2014.

DeepID neboli „Deep hidden IDentity features“ je řada systémů (např. DeepID, DeepID2 atd.).), poprvé popsaný Yi Sunem a kol. ve svém příspěvku z roku 2014 s názvem “ Deep Learning Face Representation from Predicting 10,000 Classes.“Jejich systém byl poprvé popsán podobně jako DeepFace, ačkoli byl rozšířen v následujících publikacích na podporu identifikačních i ověřovacích úkolů školením prostřednictvím kontrastních ztrát.

hlavním problémem při rozpoznávání obličeje je vyvinout efektivní funkce reprezentace pro snížení intra-osobní rozdíly, přičemž rozšíření inter-osobní rozdíly. Tvář identifikace úkolu zvyšuje inter-personální variace kreslení DeepID2 rysy extrahované z různých identit od sebe, zatímco tvář ověření snižuje intra-osobní variace tahem DeepID2 funkce extrahuje ze stejné identity, z nichž oba jsou nezbytné pro rozpoznání obličeje.

— – Deep Learning Face Representation by Joint Identification-Verification, 2014.

DeepID systémy byly mezi prvními, hluboké učení modely k dosažení lepší-než-lidský výkon na úkol, např. DeepID2 dosaženo 99.15% na Označené Plochy v Přírodě (LFW) dataset, který je lepší-než-lidské výkonnosti 97.53%. Následné systémy jako FaceNet a Vggface se na základě těchto výsledků zlepšily.

FaceNet popsal Florian Schroff, et al. na Googlu ve svém příspěvku 2015 s názvem „FaceNet: Jednotné vkládání pro rozpoznávání obličeje a shlukování.“Jejich systém dosáhl tehdy nejmodernějších výsledků a představil inovaci nazvanou „triplet loss“, která umožnila efektivní kódování obrázků jako vektorů funkcí, které umožnily rychlý výpočet podobnosti a párování pomocí výpočtů vzdálenosti.

FaceNet, který přímo učí mapování z tváře obrázky na kompaktní Euklidovský prostor, kde vzdálenosti přímo odpovídají opatření, obličej, podobnost. Naše metoda používá hluboké konvoluční sítě vyškolených přímo optimalizovat vkládání sám, spíše než středně zúžení vrstvy jako v předchozím hluboké učení přístupy. Trénovat budeme používat trojčata zhruba vyrovnány odpovídající / neodpovídající tvář záplaty vytvořené pomocí nových on-line triplet těžební metoda,

— FaceNet: Jednotný Vkládání pro Rozpoznávání Obličeje a Clustering, 2015.

návod na FaceNet naleznete zde:

  • Jak Vytvořit Systém Rozpoznávání Tváře Pomocí FaceNet v Keras

VGGFace (pro nedostatek lepšího názvu) byl vyvinut Omkar Parkhi, et al. z Visual Geometry Group (VGG) v Oxfordu a byl popsán ve svém příspěvku z roku 2015 s názvem “ Deep Face Recognition.“Kromě toho, aby lépe ladil model, zaměření jejich práce byla o tom, jak shromáždit velké přípravy datového souboru a použít tento vlak velmi hluboké CNN model pro rozpoznání obličeje, která jim umožnila dosáhnout, pak state-of-the-art výsledky na standardní databázi.

… ukážeme, jak lze velmi rozsáhlou datovou sadu (2.6 m obrázky, více než 2.6 K lidé) sestavit kombinací automatizace a člověka ve smyčce

– Deep Face Recognition, 2015—

Pro návod na VGGFace, viz:

  • Jak Provést Rozpoznávání Obličeje S VGGFace2 v Keras

i když tyto mohou být klíčem brzy milníky v oblasti hlubokého učení pro počítačové vidění, pokrok pokračoval, s velkou inovací zaměřených na ztrátu funkce efektivně trénovat modely.

pro vynikající aktuální shrnutí viz článek 2018 „hluboké rozpoznávání obličeje: průzkum.“

další čtení

tato část poskytuje více zdrojů k tématu, pokud chcete jít hlouběji.

knihy

  • příručka rozpoznávání obličeje, druhé vydání, 2011.

Face Recognition Papers

  • Face Recognition: A Literature Survey, 2003.
  • detekce obličeje: průzkum, 2001.
  • lidské a strojové rozpoznávání tváří: průzkum, 1995.
  • robustní detekce objektů v reálném čase, 2004.
  • rozpoznávání tváří pomocí Eigenfaces, 1991.

Deep Learning Face Recognition Papers

  • Deep Face Recognition: průzkum, 2018.
  • hluboké rozpoznávání obličeje, 2015.
  • FaceNet: Unified Embedding for Face Recognition and Clustering, 2015.
  • DeepFace: Closing the Gap to Human-Level Performance in Face Verification, 2014.
  • Deep Learning Face Representation by Joint Identification-Verification, 2014.
  • Deep Learning Face Representation from Predicting 10,000 Classes, 2014.
  • Multi-view Face Detection Using Deep Convolutional neuronal Networks, 2015.
  • od odpovědí na části obličeje po detekci obličeje: přístup hlubokého učení, 2015.
  • překonal výkon ověření tváře na úrovni člověka na LFW s GaussianFace, 2014.

články

  • systém rozpoznávání obličeje, Wikipedia.
  • rozpoznávání obličeje, Wikipedia.
  • detekce obličeje, Wikipedia.
  • Označené Tváří v Přírodě Dataset

Shrnutí

V tomto příspěvku, se objevil problém rozpoznávání tváří a jak hluboké učení metody lze dosáhnout nadlidský výkon.

konkrétně jste se dozvěděli:

  • rozpoznávání obličeje je široký problém identifikace nebo ověření lidí na fotografiích a videích.
  • rozpoznávání Tváře je proces, skládá se z detekce, zarovnání, funkce extrakce a rozpoznávání úkol
  • Hluboké učení modely poprvé oslovil poté překročil lidské výkonnosti pro rozpoznávání obličeje úkoly.

máte nějaké dotazy?
zeptejte se v komentářích níže a já se budu snažit odpovědět.

rozvíjejte modely hlubokého učení pro vizi ještě dnes!

Hluboké Učení pro Počítačové Vidění

Rozvíjet Své Vlastní Vidění Modely v Minutách

…s několika řádky kódu Pythonu

zjistěte, jak v mém novém Ebook:
hluboké učení pro počítačové vidění

poskytuje samostudium tutoriály na témata, jako je:
klasifikace, detekce objektů (yolo a rcnn), rozpoznávání tváří (vggface a facenet), příprava dat a mnoho dalšího…

konečně přinést hluboké učení do svých projektů vize

přeskočit akademiky. Jen Výsledky.

podívejte se, co je uvnitř

Tweet Sdílet Sdílet

Related Posts

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *