Było już o kobietach z Sympatii (i o panach), ale wszystko to było na podstawie informacji zawartych w profilu. Dzisiaj sięgniemy nieco głębiej.
Zbierając profile zebraliśmy też linki do zdjęć. Korzystając z microsoftowego Cognitive services Face API pobieramy cechy jakie udaje się rozpoznać na zdjęciach. Między innymi są to informacje o:
- wieku
- płci
- okularach
- kolorze włosów
- emocjach jakie wyraża twarz, na przykład czy osoba na zdjęciu się uśmiecha
W dużym uproszczeniu Face API to bramka do wytrenowanego modelu (zapewne sieci neuronowej). Wrzucamy zdjęcie, a w odpowiedzi dostajemy kilka parametrów, które są wynikiem porównania zdjęcia z tym czego sieć się nauczyła.
Skrypt (jaki inne z tego cyklu) znajdziecie na githubie. Pobrałem tylko dane dla zdjęć pań, nie będzie odpowiednika tego samego wpisu dla panów.
Zobaczmy co sztuczna inteligencja wyczytała ze zdjęć i jak to się ma do informacji podawanych w profilach przez ich właścicielki.
Niniejszy tekst to jedna z części cyklu. W innych częściach:
- było o kobietach z Sympatii
- a także o kobietach przez pryzmat ich zdjęć profilowych
- żeby było sprawiedliwie – było też o mężczyznach
- na koniec przygotowałem porównanie oczekiwań pań w porównaniu z deklaracjami mężczyzn (i odwrotnie)
Na początek wiek.
Czerwona linia to punkt odniesienia (taki sam wiek w profilu jak na zdjęciu). Widzimy, że na zdjęciach panie wyglądają młodziej niż w rzeczywistości. Czy to oznacza, że dobrze się trzymają (taki słaby żart, wiem) czy może dają w profilach stare zdjęcia?
Face API pozwala na rozpoznanie (z określonym prawdopodobieństwem) emocji osoby na zdjęciu. Sprawdźmy czy te emocje jakoś zmieniają się z wiekiem?
Poza happines i neutral mamy śladowe wartości, możemy je pominąć. Widzimy, że kobiety starsze przyjmują bardziej szczęśliwy wyraz twarzy kosztem neutralnego. Mają świadomość, że wyglądają wówczas korzystniej? Tak można wnioskować z wykresów powyżej.
Porównajmy tylko te dwie cechy (szczęście i neutralność):
Możemy powiedzieć, że po dwudziestce kobiety wyglądają na zdjęciach na szczęśliwsze. Tak przynajmniej są rozpoznawane przez sztuczną inteligencję.
Czy z wiekiem zmienia się kolor włosów?
Tutaj widzimy delikatny wzrost liczby (właściwie: udziału procentowego) blondynek po 30. Chodzi o zmianę koloru za pomocą farby? Tego nie wiemy, ale możemy sprawdzić kolor włosów deklarowany w profilu a ten rozpoznany na zdjęciu:
Tutaj (jak i poprzednio) w grę wchodzi sama fotografia, szczególnie oświetlenie. Można zrobić zdjęcie ciemnej blondynki tak, aby jej włosy wyglądały na brązowe (i to widać na wykresie – ciemny blond na osi Y i brown na osi X). Poza tym problemem jest liczba kategorii koloru włosów w Face API – jest ich mniej niż możliwości wyboru w profilu Sympatii. Możemy w dużym uproszczeniu przyjąć, że dla Face API blond to jasny blond, a ciemny blond to już nie blond.
Widzieliśmy zmianę popularności koloru włosów z wiekiem, a co z okularami?
Znakomita większość kobiet nie posiada okularów na zdjęciach. Z wiekiem okularnic przybywa. Czy zamiłowanie do czytania ma jakiś związek z noszeniem okularów? Czy kobiety, które deklarują wśród zainteresowań czytanie książek częściej noszą okulary?
Widać delikatne różnice, ale zobaczmy jeszcze liczby jakie stoją za słupkami:
Okulary | Czytające | Wszystkie |
---|---|---|
NoGlasses | 79.89 | 81.68 |
ReadingGlasses | 13.80 | 11.77 |
Sunglasses | 6.30 | 6.55 |
Widzimy delikatną różnicę – te czytające rzadziej na zdjęciach są bez okularów i jednocześnie częściej mają reading glasses. W przypadku okularów słonecznych prawie nie widać różnicy. Różnice są na tyle niewielkie, że nie wiem czy są istotne statystycznie (trzeba by to sprawdzić odpowiednim testem).
Wróćmy do koloru włosów (tym razem tylko rozpoznanego na zdjęciu) i zestawmy go z cechą, jaką daje nam Face API – prawdopodobieństwem, że osoba na zdjęciu się uśmiecha (to nie jest to samo co happines użyte wcześniej).
Znaczące są pierwsze trzy słupki – tutaj mamy dużo danych (co widać po liczbie kropek). Widać przede wszystkim, że głównie mamy wartości skrajne (bliskie 0 i 100). Uśrednianie ich (pozioma kreska na słupkach to mediana) ma słabe uzasadnienie, ale możemy się tak zabawić. Widać zatem, że na zdjęciach uśmiecha się więcej kobiet z brązowymi (pamiętajcie, że tutaj wpada też ciemny blond) włosami.
Czy posiadanie dzieci (i związane z tym zmęczenie ;) przenosi się na uśmiech na zdjęciach?
Wygląda na to, że ma. Powyższy wykres można przeczytać w następujący sposób: mamy nieco ponad 50% szans na to, że kobieta posiadająca dzieci uśmiechnie się na fotografii. Z kolei ta, która dzieci nie posiada uśmiechnie się w 75% przypadków.
Czy ma to związek z wiekiem? Bo może starsze uśmiechają się rzadziej, ale częściej mają dzieci?
Znowu wychodzi nam, że te, które dzieci nie maja uśmiechają się częściej na zdjęciach. I to nie zależy od wieku (ale im starsze tym więcej się uśmiechają – mówię Wam, to marketing i jego świadomość :).
Sprawdźmy teraz prawdopodobieństwo uśmiechu w zależności od województwa, z którego pochodzą kobiety.
Wygląda na to, że dziewczyny z okolic Olsztyna uśmiechają się na zdjęciach najczęściej. Najmniej (jakaś co ósma?) uśmiechają się mieszkanki podkarpackiego, więcej niż połowa kobiet z Opolszczyzny również się nie uśmiecha (na zdjęciach, według sztucznej inteligencji – pamiętajmy, że nie należy uogólniać).
Czy cechy charakteru (podane w profilu jako osobowość właścicielki) mają wpływ na uśmiech na zdjęciu?
Tutaj mamy dość prawdopodobne wyniki – najwięcej uśmiechają się kobiety spontaniczne, beztroskie i towarzyskie. Najmniej – samotniczki. Może właśnie po to są na Sympatii, żeby przestać być samotnymi i uśmiechać się więcej?
Na koniec sprawdźmy czy muzyka łagodzi obyczaje, a może raczej jaki jej gatunek podany jako ulubiony ma wpływ na uśmiech. Czego należy słuchać, żeby się uśmiechać?
Wygląda na to, że muzyka filmowa to klucz do dobrego samopoczucia. Mi osobiście muzyka filmowa kojarzy się z podniosłym nastrojem i jakąś pompatycznością – na pewno nie z radością (tutaj raczej reggae – trochę się to sprawdza).
Najbardziej dołujący jest metal. Co ciekawe (i dziwne jednocześnie) – fanki disco czy dance uśmiechają się mniej niż fanki jazzu.
Powyższe analizy to wynik jedynie rozpoznawania cech przez AI ze zdjęć oraz deklaracje podane w profilu. Czy można to traktować jako dane niepodważalne i prawdziwe?
Z tym pytaniem pozostawiam Was do… następnej (już ostatniej) części. Porównamy (wreszcie) panie i panów – ich deklaracje i oczekiwania.
Fajna analiza, inspirująca :) W szczególności podobały mi się dwa wnioski:
1. Kobiety na zdjęciach wyglądają na młodsze, niż w rzeczywistości :)
2. Kobiety, które nie mają dzieci, uśmiechają się częściej.
Mogłbyś kiedyś porównać w jakich krajach kobiety najczęściej farbują włosy i dlaczego jest to wschód europy :)