DÉVELOPPEMENT D’UN SYSTÈME CONNAISSANCE POUR BIG DATA APPLICATION AUX DONNÉES DE PHÉNOTYPAGE CHEZ LE RIZ (O. SATIVA)
Title: | DÉVELOPPEMENT D’UN SYSTÈME CONNAISSANCE POUR BIG DATA APPLICATION AUX DONNÉES DE PHÉNOTYPAGE CHEZ LE RIZ (O. SATIVA) |
Authors: | Le Ngoc Luyen |
Keywords: | Base de connaissance, Ontologie, Raisonnement, Inf ́erence, SPARQL, xR2RML, Bench- mark, NoSql, BigData, TripleStore |
Issue Date: | 2015 |
Abstract: | Depuis quelques ann ́ees, le d ́eluge de donn ́ees dans plusieurs domaines de la recherche scientifique soul`eve des d ́efis dans le traitement et l’exploitation des donn ́ees. La recherche dans le domaine bioinforma- tique n’est pas ́epargn ́ee par ce ph ́enom`ene. Ce m ́emoire pr ́esente des approches pour r ́esoudre le probl`eme de donn ́ees volumineuses stock ́ees dans des entrepˆots NoSQL en y associant la capacit ́e de recherche s ́emantique sur les donn ́ees dans un contexte de recherche agronomique. Ces approches s ́emantiques permettent d’aider ` a enrichir les donn ́ees issues d’exp ́eriences grˆace aux moteurs d’inf ́erence g ́en ́erant de nouvelles connaissances. Nous pouvons r ́esumer ces deux approches d’une part avec la r ́e ́ecriture de requˆetes et d’autre part avec la mat ́erialisation de donn ́ees en triplets RDF. Un ́etat de l’art nous a permis d’identifier et d’ ́evaluer les diff ́erentes m ́ethodes se rapportant aux approches mentionn ́ees. En pratique, seule l’approche de mat ́erialisation de donn ́ees a ́et ́e choisie pour continuer `a travailler. Les donn ́ees triplets obtenues ́etant volumineuses, nous avons r ́ealis ́e un benchmark sur diff ́erents syst`emes de gestion de base de donn ́ees de triplets afin de pouvoir comparer les avantages et les inconv ́enients de chacun et de choisir le meilleur syst`eme pour notre ́etude de cas. |
URI: | http://repository.vnu.edu.vn/handle/VNU_123/9876 |
Appears in Collections: | IFI - Master Theses |
Nhận xét
Đăng nhận xét