Sari la conținut Treci la bara laterală Sari la subsol

Folosind inteligenta artificiala, instrumentul de clasificare de la Google sorteaza si eticheteaza imaginile.

Google Vision poate clasifica automat imaginile, dar poate fi folosit si ca un instrument independent pentru a vedea modul in care un algoritm de detectare a imaginilor vizualizeaza si clasifica aceste imagini.

Este interesant sa poti testa ce pot face algoritmii Google referitori la imagini chiar daca nu folosesti API-ul Google Vision pentru a detecta si clasifica imaginile la scara larga.

Simtiti-va liber sa explorati Google Vision: incarcati o imagine si urmariti modul in care este clasificata.

Ce algoritm reflecta Cloud Vision Tool?

Google Vision este doar un model pentru invatare automata, nu un algoritm de clasificare in sensul traditional al cuvantului.

De aceea, acest instrument nu va va spune nimic despre algoritmul de clasificare a imaginilor de la Google, dar este un instrument excelent pentru a afla despre modul in care Google AI si algoritmii de invatare automata pot interpreta imaginile, si va va oferi o idee despre cat de avansati sunt algoritmii de astazi.

Ca rezultat al acestui instrument, este posibil sa aflati mai multe despre modul in care un computer ar putea interpreta o imagine si cat de bine se potriveste cu tematica generala a unei imagini.

Care sunt beneficiile utilizarii unui instrument de clasificare a imaginilor?

Imaginile pot avea un impact semnificativ asupra vizibilitatii cautarii unei pagini web si asupra ratei de clic (CTR). Ele ajuta sa directioneze vizitatorii site-ului care fac cercetari pe un anumit subiect catre cele mai relevante pagini.

Ca rezultat, in unele cazuri, utilizarea imaginilor care sunt relevante pentru interogarile de cautare poate ajuta la comunicarea rapida a faptului ca o pagina web este relevanta pentru ceea ce cauta o persoana. Intelegerea modului in care un algoritm interpreteaza ceea ce este intr-o imagine se poate face cu ajutorul instrumentului Google Vision.

Instrumentele Google de analiză a imaginii clasifică imaginile în cinci moduri diferite:

  • Obiecte
  • Fete
  • Etichete
  • Proprietati
  • Siguranta Cautarii

Google Vision: Obiecte

Algoritmul "obiecte" arata ce obiecte sunt prezente in imagine, cum ar fi ochelari, cai, persoane etc. si procentul de precizie.

Google Vision: Fete

Folosind algoritmul "fete", puteti vedea cum imaginea isi exprima emotiile. Exista un grad rezonabil de acuratete in acest rezultat. Cu un nivel de incredere de 96%, Google Vision descrie expresia fetei drept una de surprindere.

Google Vision: Etichete

Puteti vedea detalii precum urechile si gura, dar puteti vedea si mai multe aspecte conceptuale precum portretul sau fotografia print algoritmul de etichetare.

In acest caz, algoritmul de la Google arata cat de bine intelege continutul unei imagini.

Google Vision: Proprietati

Scopul acestui instrument nu este imediat vizibil si poate parea a fi complet inutil. Cand vine vorba de imaginile prezentate, culorile unei imagini pot avea un impact semnificativ asupra succesului acesteia.

Ar trebui sa cautati imagini care au o gama larga de culori, deoarece acest lucru indica faptul ca imaginea a fost aleasa prost si este prea mare. In plus, imaginile cu o gama de culori mai inchisa s-ar putea sa aiba dimensiuni mai mari.

Google Vision: Siguranta Cautarii

Clasamentul imaginii in Cautarea Google se bazeaza pe riscul de a contine continut daunator. Urmatoarele sunt descrieri ale imaginilor care pot fi periculoase: Adult, Spoof, Medical, Violence, Racy.

Exista filtre in cautarea Google care cauta continut potential daunator sau ofensator. Acesta este motivul pentru care sectiunea Cautare sigura a instrumentului este critica, deoarece, in cazul in care o imagine declanseaza in mod neintentionat un filtru de cautare sigura, este posibil ca pagina web sa nu fie afisata pentru potentialii vizitatori ai site-ului care cauta continutul de pe pagina respectiva.

In captura de ecran prezentata mai jos, a fost analizata o fotografie a cailor de curse pe o pista de curse. Nu exista continut medical sau pentru adulti in imagine, conform algoritmului de analiza.

Google Vision OCR

OCR, procesul de conversie a textului scris de mana sau tiparit in text codificat de masina, a fost de multa vreme un punct central al cercetarii viziunii computerizate, datorita gamei largi de aplicatii pe care le poate servi.

Google Cloud Vision OCR face parte din Google Cloud Vision API care ajuta la extragerea textului din imagini. Exista doua adnotari in special care pot fi folosite pentru a ajuta la recunoasterea caracterelor:

  • Adnotare text: extrage si produce text codificat automat din orice imagine (de exemplu, fotografii cu vederi ale strazii sau peisaje). Intr-o masura mai mica, capacitatea modelului de a citi cuvinte intr-o varietate de stiluri este intarita de faptul ca a fost construit de la zero pentru a functiona intr-o varietate de conditii de iluminare. Fisierul JSON returnat contine intregul sir, precum si cuvintele individuale si casetele lor de delimitare respective.
  • Adnotarea textului documentului: aceasta este cea mai potrivita pentru documente cu mult text (de exemplu, carti scanate). In timp ce acest lucru permite citirea de texte mai mici si mai concentrate, este mai putin flexibil atunci cand se ocupa de imagini legate de natura. Fisierul JSON de iesire include informatii precum paragrafe, blocuri si pauze.

Google Vision Proces OCR

1. Incarcati o imagine (la distanta sau din stocarea locala) in API-ul Google Cloud Vision.

2. Google Cloud proceseaza imaginea si genereaza formatele JSON adecvate pe baza functiei pe care ati apelat-o.

3. Dupa ce functia este procesata, fisierul JSON este returnat.

Adauga un Comentariu

> Newsletter <
Vă interesează Știrile tehnice și multe altele?

Abonati-va