Bygge av scanner med textigenkänning

Berätta om dina pågående projekt.
Användarvisningsbild
Macce
Inlägg: 4301
Blev medlem: 29 maj 2003, 16:40:58

Inlägg av Macce »

strombom får skriva in ett program som kollar på sammanhanget :D
Då blir ytterligare lite svårare :)
Användarvisningsbild
bengt-re
EF Sponsor
Inlägg: 4829
Blev medlem: 4 april 2005, 16:18:59
Skype: bengt-re
Ort: Söder om söder
Kontakt:

Inlägg av bengt-re »

http://www.e-clec-tech.com/speakjetchip.html

En billig och enkel lösning. Talet är sådär, men man begriper vad som sägs iaf..
Användarvisningsbild
strombom
Inlägg: 3305
Blev medlem: 27 maj 2003, 10:50:20
Ort: Västra Götaland
Kontakt:

Inlägg av strombom »

bengt-re: den såg intressant ut, mycket intressant datablad också!

/Johan
f76
Inlägg: 40
Blev medlem: 14 april 2005, 23:16:56

Inlägg av f76 »

Svenska uttalas till 90% procent som det skrivs dvs det finns klara regler för uttal. vokal blir kort innan dubbel konsonant osv. Kanske något att leta efter i en lärobok :).. Så behöver du en lista på konsonanter och en lista på vokaler.

Annars kan du spela in fonetiken och försöka matcha med texten.
Användarvisningsbild
strombom
Inlägg: 3305
Blev medlem: 27 maj 2003, 10:50:20
Ort: Västra Götaland
Kontakt:

Inlägg av strombom »

Nu har jag byggt en ny enhet för inscanningen som fungerar mycket bättre, både utomhus i direkt solsken och i totalt mörker (den har lysdioder som är på när den scannar). Tyvärr kan jag inte läsa text mindre än 20 punkter eftersom linsen är helt fel (från en miniatyr-tv-kamera).

Är det någon som har förslag på vad man kan använda för lins?

Sensorns aktiva yta är 6.4mm bred, och jag vill helst inte ha längre avstånd till texten än 30mm, texten ska vara max 15mm bred ungefär...

Jag har försökt hitta linser på nätet men det är inte lätt att hitta något lämpligt, de flesta har minimalt fokusavstånd på minst 200 mm tyvärr.

/Johan
Användarvisningsbild
Tripp
Inlägg: 397
Blev medlem: 29 januari 2004, 08:14:39
Ort: Tullinge
Kontakt:

Inlägg av Tripp »

Denna kanske kan vara ett alternativ.

http://www.lawicel-shop.se/shop/custom/ ... &refcode=p

/Tripp :wink:
Användarvisningsbild
strombom
Inlägg: 3305
Blev medlem: 27 maj 2003, 10:50:20
Ort: Västra Götaland
Kontakt:

Inlägg av strombom »

Tripp: Jo den kretsen har jag tänkt använda faktiskt, men jag ska beställa kretsen löst från digikey istället för en hel modul. 4*4 cm är för stort för mina ändamål...

/Johan
henkebenke
Inlägg: 515
Blev medlem: 31 maj 2003, 10:42:37
Ort: Helsingborg

Inlägg av henkebenke »

Vad jag vet så använder C-pen en ASIC för teckenigenkänningen. Har för mig att det var för att hinna med att tolka tecknen helt enkelt. Det kan bli en hel del data som ska processas snabbt när man sveper över en rad text.
Användarvisningsbild
strombom
Inlägg: 3305
Blev medlem: 27 maj 2003, 10:50:20
Ort: Västra Götaland
Kontakt:

Inlägg av strombom »

Jo men jag nöjer mig med ett teckensnitt, jag har implementerat en backpropagationalgoritm som tar fram ett neuralt nätverk som jag använder i pennan. Denna analys gör jag efter att raden är inscannad, så det blir någon sekunds väntetid efter scanningen men det duger för mig.

Jag har nog hittat en lins på laseroptronix, hoppas den fungerar bra.

Sen tänkte jag köpa den här:
http://www.elfa.se/elfa-bin/dyndok.pl?l ... k=7240.htm
Hoppas den fungerar bättre.

/Johan
Rymdninja
Inlägg: 330
Blev medlem: 15 december 2003, 13:41:25
Ort: Göteborg

Inlägg av Rymdninja »

Ren nyfikenhet: vad har du för struktur/topologi på ditt ANN?
Användarvisningsbild
strombom
Inlägg: 3305
Blev medlem: 27 maj 2003, 10:50:20
Ort: Västra Götaland
Kontakt:

Inlägg av strombom »

ett inlager med 8*8 ingångar, det hade så klart varit bra med fler men 64 känns rättså mycket beräkningsmässigt ändå. jag plockar alltså ut en bokstav med godtycklig storlek från inscanningen och anpassar den til 8*8 pixlar.

sedan har jag testat mellan 20 och 100 noder i ett mellanlager. den verkar klara att spara ner ett typsnitt (A-Z) ganska snabbt på 40 noder.

sedan har jag 25 utnoder, en för varje bokstav så plockar jag ut den som blir störst. jag tränar den så att ett A får 1 på första utgången och 0 på resten.

Jag har aldrig gjort teckenigenkänning tidigare så om ni har några idéer så tar jag gärna emot dem :)

/Johan
Seven11
Inlägg: 547
Blev medlem: 13 maj 2004, 23:43:33

Inlägg av Seven11 »

vad är det för överföringsfunktion du använder?
Användarvisningsbild
strombom
Inlägg: 3305
Blev medlem: 27 maj 2003, 10:50:20
Ort: Västra Götaland
Kontakt:

Inlägg av strombom »

funktion(x) = 1/(1+e^-x)

/Johan
Användarvisningsbild
strombom
Inlägg: 3305
Blev medlem: 27 maj 2003, 10:50:20
Ort: Västra Götaland
Kontakt:

Inlägg av strombom »

Ett litet glädjerop: wohoo

Så där nu var den klar, min egen lilla c-pen. Gick fint med 10 mellanlager i ANN:et, nästan 100% säkerhet på inscanningarna (har bara testat med ett teckensnitt åt gången änsålänge, lite fusk där). Klarar inte att hitta mellanrum mellan meningar om man inte drar med väldigt jämn hastighet, får nog sätta på en tachometer från en datormus eller något...

Den här gången organiserade jag indatan så att jag delar in varje bokstav i 5*5 rutor, sedan får varje ruta vara en ingång till neuronnätet, alltså 25 ingångar. varje ruta får sitt värde efter hur många svarta pixlar som finns i det området. Det här funkade mycket bättre än att skicka in en hel bild i nätverket och det sparade massor av minne och hastighet!

Nu använder jag bildsensorn S9227 från elfa med 512 pixlar i en rad. Ger jättefin bild, och snabbt läser den!

Har även byggt en liten handhållen plotter som skriver ut bokstäver, den är dock inte helt klar än... :P behöver en rem :twisted:

Så om någon funderar på att använda dessa bildsensorer eller vill använda neurala nätverk i en mikrokontroller så hjälper jag gärna till !
Användarvisningsbild
Fagge
Inlägg: 3930
Blev medlem: 27 maj 2003, 13:59:51
Ort: Blekinge

Inlägg av Fagge »

Jag vill se bilder :shock:
Skriv svar