En Mild Introduksjon til Dyp Læring for Ansiktsgjenkjenning

Tweet Share Share

Sist Oppdatert 5. juli 2019

Ansiktsgjenkjenning er problemet med å identifisere og verifisere personer i et fotografi med ansiktet sitt.Det er en oppgave som utføres trivielt av mennesker, selv under varierende lys og når ansikter endres etter alder eller hindres med tilbehør og ansiktshår. Likevel er det fortsatt et utfordrende datasynsproblem i flere tiår til nylig.Dype læringsmetoder er i stand til å utnytte svært store datasett av ansikter og lære rike og kompakte representasjoner av ansikter, slik at moderne modeller først kan fungere like bra og senere for å overgå ansiktsgjenkjenningsevnen til mennesker.

i dette innlegget vil du oppdage problemet med ansiktsgjenkjenning og hvor dype læringsmetoder kan oppnå overmenneskelig ytelse.

Etter å ha lest dette innlegget, vil Du vite:

Ansiktsgjenkjenning Er et bredt problem med å identifisere eller verifisere personer i fotografier og videoer.Ansiktsgjenkjenning Er en prosess som består av gjenkjenning, justering, funksjonsutvinning og en gjenkjenningsoppgave.Kick-start prosjektet med Min nye bok Deep Learning For Computer Vision, inkludert trinn-for-trinn tutorials og Python kildekodefiler for alle eksempler.
La oss komme i gang.

En Mild Introduksjon til Dyp Læring for Ansiktsgjenkjenning
Foto Av Susanne Nilsson, noen rettigheter reservert.
Oversikt

denne opplæringen er delt inn i fem deler; de er:
1. Ansikter i Fotografier
2. Prosessen Med Automatisk Ansiktsgjenkjenning
3. Ansiktsgjenkjenningsoppgave
4. Ansiktsgjenkjenningsoppgaver
5. Dyp Læring for Ansiktsgjenkjenning
Ansikter I Fotografier

Det er ofte behov for automatisk å gjenkjenne personene i et fotografi.

det er mange grunner til at vi kanskje vil gjenkjenne en person automatisk på et fotografi.

For eksempel:
- vi vil kanskje begrense tilgangen til en ressurs til en person, kalt ansiktsautentisering.
- Vi vil kanskje bekrefte at personen samsvarer MED DERES ID, kalt ansiktsverifisering.
- Vi vil kanskje tildele et navn til et ansikt, kalt ansiktsidentifikasjon.
generelt refererer vi til dette som problemet med automatisk «ansiktsgjenkjenning», og det kan gjelde både stillbilder eller ansikter i strømmer av video.

Mennesker kan utføre denne oppgaven veldig enkelt.

vi kan finne ansiktene i et bilde og kommentere hvem menneskene er, hvis de er kjent. Vi kan gjøre dette veldig bra, for eksempel når folk har alderen, har solbriller, har forskjellig farget hår, ser i forskjellige retninger og så videre. Vi kan gjøre dette så godt at vi finner ansikter der det ikke er noen, for eksempel i skyer.likevel er dette fortsatt et vanskelig problem å utføre automatisk med programvare, selv etter 60 eller flere års forskning. Inntil kanskje ganske nylig.

for eksempel er gjenkjenning av ansiktsbilder som er oppnådd i et utemiljø med endringer i belysning og/eller pose fortsatt et stort sett uløst problem. Med andre ord, dagens systemer er fortsatt langt borte fra evnen til det menneskelige oppfatningssystemet.

— Ansiktsgjenkjenning: En Litteraturundersøkelse, 2003.

Vil Du Ha Resultater Med Dyp Læring for Datasyn?

Ta min gratis 7-dagers e-lynkurs nå (med eksempelkode).

Klikk for å registrere deg og få også en GRATIS Pdf Ebook-versjon av kurset.

Last Ned Gratis Minikurs

Prosessen Med Automatisk Ansiktsgjenkjenning

Ansiktsgjenkjenning er problemet med å identifisere eller verifisere ansikter i et fotografi.

en generell uttalelse av problemet med maskingjenkjenning av ansikter kan formuleres som følger: gitt stillbilder eller videobilder av en scene, identifiser eller verifiser en eller flere personer i scenen ved hjelp av en lagret database med ansikter

— Ansiktsgjenkjenning: En Litteraturundersøkelse, 2003.Ansiktsgjenkjenning Er ofte beskrevet som en prosess som først involverer fire trinn; de er: ansiktsgjenkjenning, ansiktsjustering, funksjonsutvinning og til slutt ansiktsgjenkjenning.
1. Ansiktsgjenkjenning. Finn ett eller flere ansikter i bildet og merk med en markeringsramme.
2. Ansiktsjustering. Normaliser ansiktet for å være i samsvar med databasen, for eksempel geometri og fotometri.
3. Funksjonen Utvinning. Trekk ut funksjoner fra ansiktet som kan brukes til anerkjennelsesoppgaven.
4. Ansiktsgjenkjenning. Utfør matching av ansiktet mot ett eller flere kjente ansikter i en forberedt database.
et gitt system kan ha en egen modul eller et program for hvert trinn, som tradisjonelt var tilfelle, eller kan kombinere noen eller alle trinnene i en enkelt prosess.

en nyttig oversikt over denne prosessen er gitt i boken «Håndbok For Ansiktsgjenkjenning», gitt nedenfor:

Oversikt over Trinnene i En Ansiktsgjenkjenningsprosess. Hentet fra «Handbook Of Face Recognition», 2011.

Ansiktsgjenkjenning Oppgave

ansiktsgjenkjenning er det ikke-trivielle første trinnet i ansiktsgjenkjenning.

det er et problem med objektgjenkjenning som krever at både plasseringen av hvert ansikt i et fotografi er identifisert(f. eks. Objektgjenkjenning i seg selv er et utfordrende problem, selv om det i dette tilfellet ligner på at det bare er en type objekt, f. eks. ansikter, som skal lokaliseres, selv om ansikter kan variere vilt.

det menneskelige ansiktet er et dynamisk objekt og har en høy grad av variabilitet i utseendet, noe som gjør ansiktsgjenkjenning et vanskelig problem i datasyn.

– Ansiktsgjenkjenning: En Undersøkelse, 2001.fordi det er det første trinnet i et bredere ansiktsgjenkjenningssystem, må ansiktsgjenkjenning være robust. For eksempel kan et ansikt ikke gjenkjennes hvis det ikke først kan oppdages. Det betyr ansikter må oppdages med alle slags orienteringer, vinkler, lysnivåer, frisyrer, hatter, briller, ansiktshår, sminke, aldre og så videre.

som en visuell frontprosessor bør et ansiktsdeteksjonssystem også kunne oppnå oppgaven uavhengig av belysning, orientering og kameraavstand

— Ansiktsgjenkjenning: En Undersøkelse, 2001.

2001-artikkelen med tittelen «Face Detection: A Survey» gir en taksonomi av ansiktsgjenkjenningsmetoder som grovt kan deles inn i to hovedgrupper:
- Funksjonsbasert.
- Bildebasert.
den funksjonsbaserte ansiktsgjenkjenningen bruker håndlagde filtre som søker etter og finner ansikter i fotografier basert på dyp kunnskap om domenet. De kan være veldig raske og svært effektive når filtrene passer, selv om de kan mislykkes dramatisk når de ikke gjør det, for eksempel å gjøre dem litt skjøre.

… gjør eksplisitt bruk av ansiktskunnskap og følg den klassiske deteksjonsmetodikken der lavt nivåfunksjoner er avledet før kunnskapsbasert analyse. De tilsynelatende egenskapene til ansiktet som hudfarge og ansiktsgeometri utnyttes på forskjellige systemnivåer.

– Ansiktsgjenkjenning: En Undersøkelse, 2001.Alternativt er bildebasert ansiktsgjenkjenning helhetlig og lærer hvordan man automatisk finner og trekker ut ansikter fra hele bildet. Nevrale nettverk passer inn i denne klassen av metoder.

… adresserer ansiktsgjenkjenning som et generelt gjenkjenningsproblem. Bildebaserte representasjoner av ansikter, for EKSEMPEL I 2d-intensitetsarrayer, klassifiseres direkte i en ansiktsgruppe ved hjelp av treningsalgoritmer uten funksjonsderivasjon og analyse. disse relativt nye teknikkene innlemme ansikt kunnskap implisitt inn i systemet gjennom kartlegging og opplæring ordninger.

– Ansiktsgjenkjenning: En Undersøkelse, 2001.kanskje den dominerende metoden for ansiktsgjenkjenning som ble brukt i mange år (og ble brukt i mange kameraer) ble beskrevet i 2004-papiret med tittelen «Robust Real-time Object Detection», kalt detector cascade eller bare «cascade.»

detektoren deres, kalt detektorkaskade, består av en sekvens av enkle til komplekse ansiktsklassifiseringer og har tiltrukket seg omfattende forskningsinnsats. Videre har detector cascade blitt distribuert i mange kommersielle produkter som smarttelefoner og digitale kameraer. Mens kaskadedetektorer nøyaktig kan finne synlige oppreist ansikter, unnlater de ofte å oppdage ansikter fra forskjellige vinkler, for eksempel sidevisning eller delvis okkluderte ansikter.

– multi-view Ansiktsgjenkjenning Ved Hjelp Av Dype Convolutional Nevrale Nettverk, 2015.

for en veiledning om dyp læring for ansiktsgjenkjenning, se:
- Hvordan Utføre Ansiktsgjenkjenning Med Dyp Læring i Keras
Ansiktsgjenkjenningsoppgaver

oppgaven med ansiktsgjenkjenning er bred og kan skreddersys til de spesifikke behovene til et prediksjonsproblem.i artikkelen «Human and machine recognition of faces: a survey» fra 1995 beskriver forfatterne for eksempel tre ansiktsgjenkjenningsoppgaver:
- Face Matching: Finn den beste matchen for et gitt ansikt.
- Face Similarity: Finn ansikter som ligner mest på et gitt ansikt.
- Face Transformation: Generer nye ansikter som ligner på et gitt ansikt.
De oppsummerer disse tre separate oppgavene som følger:

Matching krever at kandidatens matchende ansiktsbilde er i et sett med ansiktsbilder valgt av systemet. Likhet deteksjon krever i tillegg til å matche at bilder av ansikter bli funnet som ligner på en tilbakekalt ansikt dette krever at likheten tiltaket brukes av anerkjennelse system tett matche likheten tiltak som brukes av mennesker Transformasjon applikasjoner krever at nye bilder laget av systemet være lik menneskelige minner om et ansikt.

– Menneskelig og maskingjenkjenning av ansikter: en undersøkelse, 1995.

2011-boken om ansiktsgjenkjenning med tittelen «Handbook Of Face Recognition» beskriver to hovedmoduser for ansiktsgjenkjenning, som:
- Ansiktsverifisering. En en-til-en kartlegging av et gitt ansikt mot en kjent identitet (f. eks er dette personen?).
- Ansiktsidentifikasjon. En en-til-mange kartlegging for et gitt ansikt mot en database med kjente ansikter (f. eks.).
et ansiktsgjenkjenningssystem forventes å identifisere ansikter som finnes i bilder og videoer automatisk. Den kan operere i en eller begge av to moduser: (1) ansiktsverifisering (eller godkjenning) og (2) ansiktsidentifikasjon (eller anerkjennelse).

– Side 1, Håndbok For Ansiktsgjenkjenning. 2011.Vi kan beskrive problemet med ansiktsgjenkjenning som en overvåket prediktiv modelleringsoppgave trent på prøver med innganger og utganger.

i alle oppgaver er inngangen et bilde som inneholder minst ett ansikt, mest sannsynlig et oppdaget ansikt som også kan ha blitt justert.

utdataene varierer basert på hvilken type prediksjon som kreves for oppgaven; for eksempel:
- det kan da være en binær klasseetikett eller binær klassesannsynlighet i tilfelle en ansiktsverifiseringsoppgave.
- Det kan være en kategoriskklasseetikett eller et sett med sannsynligheter for en ansiktsidentifikasjonsoppgave.
- Det kan være en likhet metrisk i tilfelle av en likhet type oppgave.
Dyp Læring For Ansiktsgjenkjenning

Ansiktsgjenkjenning har vært et aktivt forskningsområde innen datasyn.

kanskje en av de mer kjente og adopterte «maskinlæring» metoder for ansiktsgjenkjenning ble beskrevet i 1991 papir med tittelen » Ansiktsgjenkjenning Ved Hjelp Av Eigenfaces.»Deres metode, kalt bare «Eigenfaces», var en milepæl da den oppnådde imponerende resultater og demonstrerte evnen til enkle holistiske tilnærminger.

Ansiktsbilder projiseres på et funksjonsområde («ansiktsrom») som best koder for variasjonen blant kjente ansiktsbilder. Ansiktsrommet er definert av «egenvektorer», som er egenvektorer av settet av ansikter; de samsvarer ikke nødvendigvis med isolerte funksjoner som øyne, ører og nese

— Ansiktsgjenkjenning Ved Hjelp Av Egenvekter, 1991.2018-papiret med tittelen «Deep Face Recognition: A Survey» gir et nyttig sammendrag av tilstanden til ansiktsgjenkjenningsforskning de siste 30 årene, og fremhever den brede trenden fra holistiske læringsmetoder (Som Egenbilder), til lokal håndlaget funksjonsdeteksjon, til grunne læringsmetoder, til endelig dype læringsmetoder som for tiden er toppmoderne.

de holistiske tilnærmingene dominerte ansiktsgjenkjenningssamfunnet på 1990-tallet. På begynnelsen av 2000-tallet ble håndlagde lokale beskrivere populære, og den lokale læringsmetoden ble introdusert på slutten av 2000-tallet. ytelsen forbedres jevnt fra rundt 60% til over 90%, mens dyp læring øker ytelsen til 99,80% på bare tre år.

— Dyp Ansiktsgjenkjenning: En Undersøkelse, 2018.Gitt gjennombruddet Av AlexNet i 2012 for det enklere problemet med bildeklassifisering, var Det en flurry av forskning og publikasjoner i 2014 og 2015 på dype læringsmetoder for ansiktsgjenkjenning. Evner oppnådde raskt nesten menneskelig ytelse, og overgikk deretter menneskelig ytelse på et standard ansiktsgjenkjenningsdatasett innen en treårsperiode, noe som er en forbløffende forbedringsrate gitt de tidligere tiårene av innsatsen.det er kanskje fire milepæler på dyp læring for ansiktsgjenkjenning som kjørte disse innovasjonene; De er: DeepFace, DeepID-serien av systemer, VGGFace og FaceNet. La oss kort berøre hver.DeepFace Er et system basert på dype convolutional nevrale nettverk beskrevet Av Yaniv Taigman, et al. FACEBOOK AI Research Og Tel Aviv. Det ble beskrevet i 2014-papiret med tittelen » DeepFace: Closing The Gap to Human-Level Performance in Face Verification.»Det var kanskje det første store spranget fremover ved hjelp av dyp læring for ansiktsgjenkjenning, oppnå nær menneskelig nivå ytelse på et standard benchmark datasett.

vår metode når en nøyaktighet på 97,35% På De Merkede Ansiktene i Naturen (LFW) datasettet, noe som reduserer feilen i dagens toppmoderne med mer enn 27%, nærmer seg menneskelig ytelse.

— DeepFace: Lukker Gapet Til Menneskelig Nivå Ytelse I Ansiktsverifisering, 2014.

DeepID, Eller «Deep hidden IDentity features», er en serie systemer (F. Eks. DeepID, DeepID2, Etc.), først beskrevet Av Yi Sun, et al. I sin 2014 papir med tittelen «Deep Learning Face Representasjon Fra Forutsi 10,000 Klasser.»Deres system ble først beskrevet som DeepFace, selv om det ble utvidet i etterfølgende publikasjoner for å støtte både identifikasjons – og verifikasjonsoppgaver ved å trene via kontrastivt tap.

den viktigste utfordringen med ansiktsgjenkjenning er å utvikle effektive funksjonsrepresentasjoner for å redusere intra-personlige variasjoner mens du forstørrer inter-personlige forskjeller. Ansiktsidentifikasjonsoppgaven øker de interpersonlige variasjonene ved å trekke DeepID2-funksjoner hentet fra forskjellige identiteter fra hverandre, mens ansiktsverifiseringsoppgaven reduserer de intra-personlige variasjonene ved å trekke DeepID2-funksjoner hentet fra samme identitet sammen, som begge er avgjørende for ansiktsgjenkjenning.

– Dyp Læring Ansiktsrepresentasjon Ved Felles Identifikasjon-Verifisering, 2014. DeepID-systemene var blant de første dyplæringsmodellene for å oppnå bedre enn menneskelig ytelse på oppgaven, For Eksempel Oppnådde DeepID2 99,15% på Datasettet Merket Ansikter i Naturen (LFW), som er bedre enn menneskelig ytelse på 97,53%. Etterfølgende systemer som FaceNet og VGGFace forbedret disse resultatene.FaceNet ble beskrevet Av Florian Schroff, et al. På Google i deres 2015-papir med tittelen » FaceNet: En Enhetlig Innebygging for Ansiktsgjenkjenning og Clustering. Deres system oppnådde da state-of-the-art resultater og presenterte en innovasjon kalt «triplet loss» som tillot bilder å bli kodet effektivt som funksjonsvektorer som tillot rask likhetsberegning og matching via avstandsberegninger.

FaceNet, som direkte lærer en kartlegging fra ansiktsbilder til et kompakt Euklidisk rom hvor avstander direkte tilsvarer et mål på ansiktslikhet. Vår metode bruker et dypt convolutional nettverk trent til å optimalisere selve innebyggingen, i stedet for et mellomliggende flaskehalslag som i tidligere dype læringsmetoder. For å trene bruker vi trillinger av grovt justerte matchende / ikke-matchende ansiktspatcher generert ved hjelp av en ny online triplett— gruvemetode

– FaceNet: En Enhetlig Innebygging For Ansiktsgjenkjenning og Clustering, 2015.

for en tutorial På FaceNet, se:
- Hvordan Utvikle Et Ansiktsgjenkjenningssystem Ved Hjelp Av FaceNet I Keras
VGGFace (i mangel av et bedre navn) ble utviklet av Omkar Parkhi, et al. Fra Visual Geometry Group (VGG) Ved Oxford og ble beskrevet i deres 2015 papir med tittelen » Deep Face Recognition.»I tillegg til en bedre innstilt modell var fokuset på arbeidet deres på hvordan man samler et veldig stort treningsdatasett og bruker dette til å trene en veldig dyp CNN-modell for ansiktsgjenkjenning som tillot dem å oppnå toppmoderne resultater på standard datasett.

… vi viser hvordan et veldig stort datasett (2.6 m bilder, over 2.6 K personer) kan settes sammen av en kombinasjon av automatisering og menneske i løkken

— Dyp Ansiktsgjenkjenning, 2015.

For en tutorial På VGGFace, se:
- Hvordan Utføre Ansiktsgjenkjenning Med VGGFace2 I Keras
Selv om disse kan være de viktigste tidlige milepæler innen dyp læring for datasyn, fremgang har fortsatt, med mye innovasjon fokusert på tap funksjoner for å effektivt trene modellene.

for et utmerket oppdatert sammendrag, se 2018-papiret » Deep Face Recognition: A Survey.»

Videre Lesing

denne delen gir flere ressurser om emnet hvis du ønsker å gå dypere.

Bøker
- Håndbok For Ansiktsgjenkjenning, Andre Utgave, 2011.
Ansiktsgjenkjenningspapirer
- Ansiktsgjenkjenning: En Litteraturundersøkelse, 2003.
- Ansiktsgjenkjenning: En Undersøkelse, 2001.Menneskelig og maskingjenkjenning av ansikter: en undersøkelse, 1995.
- Robust Objektgjenkjenning I Sanntid, 2004.
- Ansiktsgjenkjenning Ved Hjelp Av Egne Ansikter, 1991.
Deep Learning Face Recognition Papers
- Dyp Ansiktsgjenkjenning: En Undersøkelse, 2018.
- Dyp ansiktsgjenkjenning, 2015.
- FaceNet: En Enhetlig Embedding For Ansiktsgjenkjenning og Clustering, 2015.DeepFace: Lukker Gapet Til Menneskelig Nivå Ytelse I Ansiktsverifisering, 2014.
- Dyp Læring Ansikt Representasjon Ved Felles Identifikasjon-Verifisering, 2014.
- Deep Learning Face Representasjon Fra Å Forutsi 10.000 Klasser, 2014.
- Multi-view Ansiktsgjenkjenning Ved Hjelp Av Dype Convolutional Nevrale Nettverk, 2015.
- Fra Facial Parts Responses To Face Detection: A Deep Learning Approach, 2015.
- Overgår Menneskelig Nivå Ansiktsverifiseringsytelse PÅ LFW Med GaussianFace, 2014.
Artikler
- ansiktsgjenkjenningssystem, Wikipedia.
- ansiktsgjenkjenning, Wikipedia.
- ansiktsgjenkjenning, Wikipedia.
- Merkede Ansikter i Det ville Datasettet
Sammendrag

i dette innlegget oppdaget du problemet med ansiktsgjenkjenning og hvor dype læringsmetoder kan oppnå overmenneskelig ytelse.

Spesielt lærte Du:
- Ansiktsgjenkjenning er et bredt problem med å identifisere eller verifisere personer i fotografier og videoer.Ansiktsgjenkjenning Er en prosess som består av gjenkjenning, justering, funksjonsutvinning og en gjenkjenningsoppgave.
har du noen spørsmål?
Still dine spørsmål i kommentarfeltet nedenfor, og jeg vil gjøre mitt beste for å svare.

Utvikle Dype Læringsmodeller For Visjon I Dag!

Utvikle Dine Egne Visjonsmodeller på Få Minutter

…Med bare noen få linjer med python-kode

Oppdag hvordan i min nye Ebok: Dyp Læring for Datasyn

Det gir selvstudium tutorials om emner som:klassifisering, objektdeteksjon (yolo og rcnn), ansiktsgjenkjenning (vggface og facenet), dataforberedelse og mye mer…

Endelig Få Dyp Læring Til Dine Visjonsprosjekter

Hopp Over Akademikerne. Bare Resultater.

Se Hva Som Er Inni

Tweet Share Share

Adam Faliq

En Mild Introduksjon til Dyp Læring for Ansiktsgjenkjenning

Oversikt

Ansikter I Fotografier

Vil Du Ha Resultater Med Dyp Læring for Datasyn?

Prosessen Med Automatisk Ansiktsgjenkjenning

Ansiktsgjenkjenning Oppgave

Ansiktsgjenkjenningsoppgaver

Dyp Læring For Ansiktsgjenkjenning

Videre Lesing

Bøker

Ansiktsgjenkjenningspapirer

Deep Learning Face Recognition Papers

Artikler

Sammendrag

Utvikle Dype Læringsmodeller For Visjon I Dag!

Utvikle Dine Egne Visjonsmodeller på Få Minutter

Endelig Få Dyp Læring Til Dine Visjonsprosjekter

Legg igjen en kommentar Avbryt svar