FIŞĂ DE EVIDENŢĂ NR.
FIŞĂ DE EVIDENŢĂ NR.
a rezultatelor activităţilor de cercetare-dezvoltare
TABEL NR. 1
DENUMIREA PROIECTULUI | Sistem de extragere de informații pentru limba română cu păstrarea confidențialității datelor | CATEGORIA DE PROIECT: Cercetare-dezvoltare | |||
CONTRACT DE FINANŢARE | 225 PED/2017 | DURATĂ CONTRACT | 15 luni | ACRONIM PROGRAM | PN-III |
VALOAREA PROIECTULUI (INCLUDE ŞI ALTE SURSE) | 627.928 | VALOAREA CONTRACTULUI DE FINANŢARE (BUGET DE STAT) | 474.829,85 | ||
REZULTATELE CERCETĂRII APARŢIN | ACADEMIA TEHNICA MILITARĂ „XXXXXXXXX X” CERTSIGN SA | CONFORM: Acordului ferm de colaborare A6796 din 22.09.2017 |
1)DENUMIRE REZULTAT | ||||
2)CATEGORIA REZULTATULUI (conform art. 74,O.G. 57/2002) | Rezultat final | Rezultate intermediare | CARACTERISTICI ALE REZULTATULUI ETAPEI | |
2.1 documentaţii, studii, lucrări | | Rezultatele sunt reprezentate de: Raportprivindstadiulcomponentelorsistemuluipropus (state-of-the art). Documentațieprivindarhitecturasistemuluipropus Site–ul web dedicate pentru prezentarea proiectului (informații actualizate la zi). Componentele software separate din cadrul sistemului: - D3 - Componenta software : WebCrawler - D4 - Componenta software : Preprocesator text - D5 - Componenta software : Sistem recunoaștere entități denumite (NER) - D6 - Componenta software : Sistem extragere relații (RE) - D7 - Componenta software : ontologie + API ontologie D8 - Software :Sistemul functional de extragere de informații propus în proiect (integrează componentele D3- D7). | ||
2.2 planuri, scheme | | |||
2.3 tehnologii | ||||
2.4 procedee, metode | ||||
2.5 produse informatice | | |||
2.6 reţete, formule | ||||
2.7 obiecte fizice/produse | ||||
2.8 brevet invenţie/altele asemenea | ||||
3) STADIUL DE DEZVOLTARE | 3.1 soluţie/model conceptual | |||
3.2 model experimental/ funcţional | |
3.3 prototip | Sistemul functional este reprezentat de o serie de componente legate serial (iesirea unui modul reprezinta intrarea urmatorului). Astfel, sistemul se apeleaza printr-un script in care se precizeaza folderul intrare (care va contine toate fisierele text din care vor fi extrase relatii) si folderul iesire (unde se va stoca ontologia rezultata). Sistemul apeleaza pe rand componentele necesare pentru a transforma textul din limbaj natural in noduri semantice in graful creat În plus față de livrabilele asumate prin proiect au fost realizate 3 livrabile adiționale: DX1 - WordNet API pentru limba romana (componenta software) Acest API (pentru Python3) permite interogarea grafului semantic WordNet pentru limba romana. Se pot accesa literali, cu filtare a partii de vorbire. Se pot caută legături în graful semantic folosind de asemenea filtre pentru tipurile de relații între nodurile rețelei (ex: hypernimie, meronimie, instance-of, etc.), Menținonăm că nu mai există un astfel de API pentru limba română, sau pentru a accesa datele din RoWordNet. Codul este complet documentat, există numeroase exemple de utilizare. DX2 - Corpus adnotat pentru NER (resursa lingvistica) Acest livrabil reprezinta un rezultat important în cadrul proiectului deoarece contine o resursa unică pentru Romania: un corpus cu peste 5000 de propoziții adnotate cu peste 26000 entități din 16 clase diferite. Acest corpus a stat la baza antrenării sistemului de detecție entități, și poate fi public folosit pentru a antrena sisteme ulterioare mai performante. Pachetul conține și ghidul de adnotare care explică metodologia de adnotare alături de exemple pentru fiecare tip de entitate. DX3 - Platforma adnotare corpus NER (componenta software adaptata) | |||
3.4 instalaţie pilot sau echivalent | ||||
3.5 altele | ||||
4) DOMENIUL DE CERCETARE | 4.1 tehnologiile societăţiiinformaţ ionale | |||
4.2 energie | ||||
4.3 mediu | ||||
4.4 sănătate | ||||
4.5 agricultura, securitatea şisiguranţa alimentară | ||||
4.6 biotehnologii | ||||
4.7 materiale, procese şi produse inovative | ||||
4.8 spaţiuşi securitate | | |||
4.9 cercetări socio-economice şi umaniste | ||||
5) DOMENII DE APLICABILITATE | SECURITATE |
Acest livrabil conține soft-ul open source BRAT ( xxxx://xxxx.xxxxxx.xxx ) care a fost adaptat pentru a putea adnota entități denumite în cadrul proiectului. Astfel, în arhiva de pe site-ul proiectului se afla soft-ul integral, putând fi rapid instalat și utilizat pentru a extinde corpusul (o activitate de dorit în viitor, deoarece acest corpus poate fi extins ușor). | ||||
6) CARACTERUL INOVATIV | 6.1 produs nou | | ||
6.2 produs modernizat | ||||
6.3 tehnologie nouă | ||||
6.4 tehnologie modernizată | ||||
6.5 serviciu nou | ||||
6.6 serviciu modernizat | ||||
6.7 altele | ||||
INFORMAŢII PRIVIND PROPRIETATEA INTELECTUALĂ | ||||
documentaţietehnico-economică | ||||
cerere înregistrare brevet de invenţie | nr...........data.............. | |||
brevet de invenţie înregistrat (naţional, european, internaţional) | nr...........data ............. | |||
Cerere înregistrare modele şi desene industriale protejate | nr...........data.............. | |||
Modele şi desene industriale protejate înregistrate (naţional, european, internaţional) | nr...........data ............. | |||
Cerere înregistrare marcă înregistrată | nr...........data.............. | |||
Mărci înregistrate (naţional, european, internaţional) | nr...........data ............. | |||
Cerere înregistrare copyright | nr...........data.............. | |||
înregistrare copyright (naţional, european, internaţional) | nr...........data ............. | |||
Cerere înregistrare reţele, indicaţii geografice, specii vegetale şi animale, etc. | nr...........data.............. | |||
înregistrare reţele, indicaţii geografice, specii vegetale şi animale, etc. (naţional, european, internaţional) | nr...........data ............. |
TABEL NR. 2
7) VALORIFICAREA REZULTATELOR CERCETĂRII | ||||||||
8) DENUMIREA REZULTATULUI DE CERCETARE | SPECIFICAŢIE DE SISTEM PENTRU SRATP | |||||||
NR. CRT. | VALOAREA DE LA CARE ÎNCEPE NEGOCIEREA | PROCES VERBAL NR./DATA | MOD DE VALORIFICARE | ACTUL PRIN CARE S-A REALIZAT VALORIFICAREA | VALOAREA NEGOCIATĂ | BENEFICIAR | IMPACT | PERSOANE AUTORIZATE |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Director proiect:
Xxxx.xxxx.xx.xxx.