Օգտագործողի ուղեցույց

Ինչպես աջակցել տվյալների պիտակավորման գործընթացին

Այս էկրանը տվյալների պիտակավորման գործընթացի առաջին փուլն է ներկայացնում: Օգտագործողը կարող է ընտրել որևէ էջ հին ձեռագրերի թվային կրկնօրինակների ցանկից և պիտակավորման համար նախատեսված էկրանից իրականացնել ընտրված էջի տվյալների պիտակավորումը: Մասնակցելով այս գործընթացին` օգտագործողները կարող են մեզ օգնել բարելավելու մեր մեքենայական ուսուցման ալգորիթմների որակը:

Article

Ինչպես է աշխատում տվյալների պիտակավորումը

Նկարներից տեքստի ստացման ծրագրակազմի աշխատանքի համար մենք հիմնվում ենք մի ուղղության վրա, որը կոչվում է վերահսկվող ուսուցում (supervised learning): Սա մեքենայական ուսուցման ենթաճյուղ է, որին հետևող ալգորիթմները, երկու բառով, կարիք ունեն բազմաթիվ ճիշտ պիտակավորված տվյալների, որպեսզի սովորեն նոր՝ նախկինում իրենց չհանդիպած օրինակների պիտակը (մեր դեպքում՝ տեքստը): Որպեսզի հնարավոր լինի հավաքել բավարար քանակությամբ տվյալներ, մենք ստեղծել ենք տվյալների պիտակավորման համար նախատեսված հատուկ պրոցես: Այն աշխատում է հետևյալ կերպ. մեր ալգորիթմներից մեկը տվյալ հին ձեռագրի թվային կրկնօրինակը բաժանում է տողերի, այնուհետև, յուրաքանչյուր տողի վրա փորձում է գտնել առանձին սիմվոլներ կամ սիմվոլների հատուկ խմբեր: Հաջորդիվ, օգտագործողը իր էկրանին տեսնում է վերոնշյալ տեղայնացման արդյունքը և նրան մնում է պարզապես նշել յուրաքանչյուր սիմվոլի ճիշտ պիտակը: Ներդրված մեթոդով մեզ հաջողվում է բավական արագ մշակել մեծ թվով ձեռագրերի էջեր և հավաքել անհրաժեշտ տվյալները:

Article

Ինչպես փորձարկել մեքենայական ուսուցման ալգորիթմները

«Խաղադաշտ» էջի հիմնական նպատակն է հնարավորություն տալ մեր օգտագործողներին կոնկրետ օրինակների վրա զգալու ինչպես են աշխատում մեքենայական ուսուցման ալգորիթմները: Այս նպատակով մեր սերվերներում տեղադրել ենք մեր հիմնական ալգորիթմներից մեկի փոքրիկ, գերպարզեցված օրինակը, իսկ դիտարկիչում ստեղծել ենք մեթոդներ, որոնք հնարավորություն են տալիս փոխազդելու նկարների հետ՝ կիրառելով երկրաչափական որոշ ձևափոխություններ և նկարների մշակման մի շարք մեթոդներ: Տառի կամ տառերի խմբի նկարը ցուցադրվում է էկրանին, և օգտագործողը հնարավորություն ունի կիրառելու նկարի ձևափոխությունները և հարցում անելու ալգորիթմին, թե ինչ տեքստային տվյալ է այն տեսնում: Նման կերպ, առնվազն մակերեսայնորեն, կարելի է պատկերացում կազմել, թե ինչպես կարող է աշխատել նկարից տեքստի ստացման ծրագրակազմը: Խաղադաշտի էջ հասնելու համար, ուղղակի հետևեք Կանխատեսել անվանումով կոճակին՝ սիմվոլների շտեմարանում տեղակայված նկարների վրայից կամ մկնիկի աջ կոճակի սեղմումին՝ Վիճակագրություն էջի պիտակների վրայից:

Article

Ինչ է պիտակների շտեմարանը

Պիտակների շտեմարանը կազմված է ձեռքով պիտակավորված նկարներից: Յուրաքանչյուր պիտակի (մեկ սիմվոլ կամ սիմվոլների խումբ) համար, համապատասխան շտեմարանը պարունակում է նկարների օրինակներ, որոնք ունեն տրված պիտակը: Օգտագործողը կարող է հետազոտել սիմվոլների նկարների վիճակագրական հատկանիշները, ինչպես նաև տեսնել հին ձեռագրերում հանդիպող նույն պիտակով սիմվոլների զանազանությունը:

Article