Projet de dictionnaires arabes
4 participants
Page 61 sur 90
Page 61 sur 90 • 1 ... 32 ... 60, 61, 62 ... 75 ... 90
Re: Projet de dictionnaires arabes
Oui j'ai utilisé le mot clef sql UNION ALL pour avoir les racines des 3 tables (2 tables nouns et verbs du premiers dico + 1 table root du second dico)
Si tu te formes en sql regarde y les prédicats standard comme order by, group by, distinct etc
Autrement il y a des problèmes dans l'import de semanticnoun. Est-ce que tu veux vérifier que le chiffre final correspond bien au nombre de lignes ? Parce qu'apparemment il y a des trous, il manque ici le 80690 que je ne retrouve pas
Encore ici le 80697 et un lien 0 vers derivednoun qui est invalide car le premier derivednoun commence avec le numéro 1
C'est valable aussi avec semanticverb et cela se répercute donc automatiquement sur assimilatedadjective par exemple.
Donc il va y avoir une certaine perte de données au final pour commencer.
Si tu te formes en sql regarde y les prédicats standard comme order by, group by, distinct etc
Autrement il y a des problèmes dans l'import de semanticnoun. Est-ce que tu veux vérifier que le chiffre final correspond bien au nombre de lignes ? Parce qu'apparemment il y a des trous, il manque ici le 80690 que je ne retrouve pas
- Code:
(80689,132340,13722,N'S',0)
(80702,132351,0,N'S',0)
(80691,132341,13960,N'S',0)
Encore ici le 80697 et un lien 0 vers derivednoun qui est invalide car le premier derivednoun commence avec le numéro 1
- Code:
(80695,132345,14583,N'S',0)
(80696,132346,14676,N'S',0)
(80701,132350,0,N'S',0)
(80698,132347,14929,N'S',0)
(80699,132348,14930,N'S',0)
(80700,132349,15306,N'S',0)
(80703,132352,16865,N'S',0)
(80704,132353,18109,N'S',0)
- Code:
(80702,132351,0,N'S',0)
(80701,132350,0,N'S',0)
C'est valable aussi avec semanticverb et cela se répercute donc automatiquement sur assimilatedadjective par exemple.
Donc il va y avoir une certaine perte de données au final pour commencer.
Adel Medine- Messages : 643
Points : 655
Date d'inscription : 09/09/2013
Re: Projet de dictionnaires arabes
السلام عليكم ورحمة الله وبركاته
Oui je vois aussi qu'il manque certains numéros...
Si on ne peut pas récupérer toutes les infos est-ce qu'au moins celles qui sont récupérées sont fiables (malgré les erreurs qui empêchent de récupérer toute les infos) ?
La deuxième base recense 6900 racines c'est le plus grand nombre que j'ai vu jusqu'à maintenant mais c'est vrai qu'il faudrait voir ce qu'il en est du Lane's lexicon et du Kasimirski. Dans le معجم اللغة العربية المعاصرة il semble y en avoir 5778 (certaines ne sont vraiment des racines).
Oui je vois aussi qu'il manque certains numéros...
Si on ne peut pas récupérer toutes les infos est-ce qu'au moins celles qui sont récupérées sont fiables (malgré les erreurs qui empêchent de récupérer toute les infos) ?
Adel Medine a écrit:Tu disais que ces 2 dicos étaient les plus gros mais ne représentent qu'environ "que" 10 000 racines pour environ 100 000 mots ?
On sait combien de racines et de mots contient le lane lexicon et de manière générale la langue arabe et le Coran ?
La deuxième base recense 6900 racines c'est le plus grand nombre que j'ai vu jusqu'à maintenant mais c'est vrai qu'il faudrait voir ce qu'il en est du Lane's lexicon et du Kasimirski. Dans le معجم اللغة العربية المعاصرة il semble y en avoir 5778 (certaines ne sont vraiment des racines).
Ibn Nacer- Messages : 1990
Points : 2234
Date d'inscription : 04/09/2011
Re: Projet de dictionnaires arabes
Salâm
Oui les données récupérées sont fiables. Je ne peux juste pas récupérer les données fausses ou inexistantes dans le script de départ.
Pour le formatage cela risque par contre d'être plus complexe en sql finalement. Je vais te fournir quelque chose comme cela pour les singuliers avec leurs pluriels brisés:
singulier 1, pluriel brisé 1.1, root, pattern singulier, pattern pluriel, gender
singulier 1, pluriel brisé 1.2, root, pattern singulier, pattern pluriel, gender
singulier 2, pluriel brisé 2.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.2, root, pattern singulier, pattern pluriel, gender
etc..
Le root n'apparaît qu'une fois car je considère qu'il est le même pour le singulier ou le pluriel. Par contre on voit qu'il y a autant de lignes que de couples singulier/pluriel. Il n'y a pas une seule ligne pour un singulier avec tous ces pluriels en colonnes. (on pourrait mais cela me prendrait plus de temps en sql)
Même problème de formatage pour avoir tous les noms et verbes avec leurs meanings. (mettre le dico à plat)
nom 1, root, pattern, meaning 1
nom 1, root, pattern, meaning 2
nom 1, root, pattern, meaning 3
nom 2, root, pattern, meaning 1
nom 2, root, pattern, meaning 2
nom 2, root, pattern, meaning 3
verbe 1, root, pattern, meaning 1
verbe 1, root, pattern, meaning 2
verbe 1, root, pattern, meaning 3
verbe 2, root, pattern, meaning 1
verbe 2, root, pattern, meaning 2
verbe 2, root, pattern, meaning 3
Oui les données récupérées sont fiables. Je ne peux juste pas récupérer les données fausses ou inexistantes dans le script de départ.
Je n'ai pas encore regardé où se trouvent les informations sur le numéro de la forme et de la porte du verbe. Elles sont dans la table pattern ?Les schèmes sont indiqués mais est-ce que serait possible d'ajouter le nombre en plus genre forme I, II, III... ? Et en plus pour la forme I, rajouter la porte uu, ai, aa...
L'association est facile je peux la donner inchâ-a Allâh.
C'est normalement possible avec 2 listes qui ont les mêmes colonnes mais pour le verbe on peut avoir des colonnes que le nom n'a pas (ex : assimilatedadjective, gerund aussi il me semble) du coup j’exclurais ces colonnes pour fusionner les 2 listes ou mettrais une valeur vide pour le nom.Est-ce possible de fusionner les deux listes en mettant les verbes d’abord et les noms ensuite et ceux pour chaque racine ?
Pour le formatage cela risque par contre d'être plus complexe en sql finalement. Je vais te fournir quelque chose comme cela pour les singuliers avec leurs pluriels brisés:
singulier 1, pluriel brisé 1.1, root, pattern singulier, pattern pluriel, gender
singulier 1, pluriel brisé 1.2, root, pattern singulier, pattern pluriel, gender
singulier 2, pluriel brisé 2.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.2, root, pattern singulier, pattern pluriel, gender
etc..
Le root n'apparaît qu'une fois car je considère qu'il est le même pour le singulier ou le pluriel. Par contre on voit qu'il y a autant de lignes que de couples singulier/pluriel. Il n'y a pas une seule ligne pour un singulier avec tous ces pluriels en colonnes. (on pourrait mais cela me prendrait plus de temps en sql)
Même problème de formatage pour avoir tous les noms et verbes avec leurs meanings. (mettre le dico à plat)
nom 1, root, pattern, meaning 1
nom 1, root, pattern, meaning 2
nom 1, root, pattern, meaning 3
nom 2, root, pattern, meaning 1
nom 2, root, pattern, meaning 2
nom 2, root, pattern, meaning 3
verbe 1, root, pattern, meaning 1
verbe 1, root, pattern, meaning 2
verbe 1, root, pattern, meaning 3
verbe 2, root, pattern, meaning 1
verbe 2, root, pattern, meaning 2
verbe 2, root, pattern, meaning 3
Adel Medine- Messages : 643
Points : 655
Date d'inscription : 09/09/2013
Re: Projet de dictionnaires arabes
وعليكم السلام ورحمة الله وبركاتهAdel Medine a écrit:Salâm
Oui les données récupérées sont fiables. Je ne peux juste pas récupérer les données fausses ou inexistantes dans le script de départ.
Ah bah tant mieux c'est déjà ça al hamduliLlâh.
Oui c'est ça.Adel Medine a écrit:Je n'ai pas encore regardé où se trouvent les informations sur le numéro de la forme et de la porte du verbe. Elles sont dans la table pattern ?
Ok.Adel Medine a écrit:C'est normalement possible avec 2 listes qui ont les mêmes colonnes mais pour le verbe on peut avoir des colonnes que le nom n'a pas (ex : assimilatedadjective, gerund aussi il me semble) du coup j’exclurais ces colonnes pour fusionner les 2 listes ou mettrais une valeur vide pour le nom.
Ok c'est bien aussi comme ça.Adel Medine a écrit:Pour le formatage cela risque par contre d'être plus complexe en sql finalement. Je vais te fournir quelque chose comme cela pour les singuliers avec leurs pluriels brisés:
singulier 1, pluriel brisé 1.1, root, pattern singulier, pattern pluriel, gender
singulier 1, pluriel brisé 1.2, root, pattern singulier, pattern pluriel, gender
singulier 2, pluriel brisé 2.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.2, root, pattern singulier, pattern pluriel, gender
etc..
Le root n'apparaît qu'une fois car je considère qu'il est le même pour le singulier ou le pluriel. Par contre on voit qu'il y a autant de lignes que de couples singulier/pluriel. Il n'y a pas une seule ligne pour un singulier avec tous ces pluriels en colonnes. (on pourrait mais cela me prendrait plus de temps en sql)
Même problème de formatage pour avoir tous les noms et verbes avec leurs meanings. (mettre le dico à plat)
nom 1, root, pattern, meaning 1
nom 1, root, pattern, meaning 2
nom 1, root, pattern, meaning 3
nom 2, root, pattern, meaning 1
nom 2, root, pattern, meaning 2
nom 2, root, pattern, meaning 3
verbe 1, root, pattern, meaning 1
verbe 1, root, pattern, meaning 2
verbe 1, root, pattern, meaning 3
verbe 2, root, pattern, meaning 1
verbe 2, root, pattern, meaning 2
verbe 2, root, pattern, meaning 3
Bâraka Allâhu fîka.
Ibn Nacer- Messages : 1990
Points : 2234
Date d'inscription : 04/09/2011
Re: Projet de dictionnaires arabes
Salam
Voici un exemple pour la requête des singuliers avec leurs pluriels brisés Il y a en tout 11 942 lignes.
En dehors du sens(table meaning) et ce qui s'y rattache(source, example..), il y a d'autres informations qui sont possibles à récupérer et qui sont en liens avec chaque couple singulier/pluriel.(ex : région, nombre,semantic scope, etc..)
Lien pour télécharger le fichier excel
Voici la requête sql, je t'ai mis quelques commentaires :
Tu as bien vérifié avant ? Parce qu'il n'y a pas cette info dans la table pattern ni ailleurs apparemment..Oui c'est ça.
Sinon tu le voyais présenté comment autrement dans un tableur ?Ok c'est bien aussi comme ça.
Voici un exemple pour la requête des singuliers avec leurs pluriels brisés Il y a en tout 11 942 lignes.
root | singular type | plural type | singular genre | plural genre | singular noun | plural noun | singular pattern | plural pattern |
ءبد | اسم | اسم | مؤنَّث | مؤنَّث | آبِدَة | أَوَابِد | فَاعِلَة | فَوَاعِل |
ءبد | اسم | اسم | مذكَّر | مذكَّر | أَبَد | آبَاد | فَعَل | أَفْعَال |
ءبد | اسم | اسم | مذكَّر | مذكَّر | أَبَد | أُبُود | فَعَل | فُعُوْل |
ءبر | اسم | اسم | مؤنَّث | مذكَّر | مِئْبَرَة | مَآبِر | مِفْعَلَة | مَفَاعِل |
ءبر | اسم | اسم | مذكَّر | مذكَّر | أَبُور | أُبُر | فَعُول | فُعُل |
ءبر | اسم آلة | اسم | مؤنَّث | مؤنَّث | إِبْرة | إِبَر | فِعْلَة | فِعَل |
ءبر | اسم آلة | اسم | مؤنَّث | مؤنَّث | إِبْرَة | إِبَر | فِعْلَة | فِعَل |
ءبر | اسم آلة | اسم | مؤنَّث | مذكَّر | إِبْرة | إِبَار | فِعْلَة | فِعَال |
ءبر | اسم آلة | اسم | مؤنَّث | مذكَّر | إِبْرَة | إِبَار | فِعْلَة | فِعَال |
ءبر | اسم آلة | اسم | مذكَّر | مذكَّر | مِئْبَر | مَآبِر | مِفْعَل | مَفَاعِل |
ءبر | اسم مكان | اسم | مذكَّر | مذكَّر | مَأْبَر | مَآبِر | مَفْعَل | مَفَاعِل |
ءبزم | اسم آلة | اسم | مذكَّر | مذكَّر | إِبْزِيم | أًبازيم | فِعْلِيل | فَعَالِيل |
ءبزن | اسم | اسم | مذكَّر | مذكَّر | أَبْزَن | أَبازِن | فَعْلَل | فَعَالِل |
ءبض | اسم | اسم | مذكَّر | مذكَّر | إِبَاض | أُبُض | فِعَال | فُعُل |
ءبض | اسم | اسم | مذكَّر | مذكَّر | أَبُوض | أُبُض | فَعُول | فُعُل |
ءبض | اسم | اسم | مذكَّر | مذكَّر | مَأْبِض | مَآبِض | مَفْعِل | مَفَاعِل |
ءبط | اسم | اسم | مذكَّر | مذكَّر | إِباط | أُبُط | فِعَال | فُعُل |
ءبط | اسم | اسم | مذكَّر ومؤنَّث | مذكَّر ومؤنَّث | إِبِط | آبَاط | فِعِل | أَفْعَال |
ءبط | اسم | اسم | مذكَّر ومؤنَّث | مذكَّر ومؤنَّث | إِبْط | آبَاط | فِعْل | أَفْعَال |
ءبل | اسم | اسم | مؤنَّث | مؤنَّث | إِبَالَة | أَبَائِل | فِعَالة | فَعَائِل |
ءبل | اسم | اسم | مؤنَّث | مؤنَّث | أَبِيل | آبَال | فَعِيْل | أَفْعَال |
ءبل | اسم | اسم | مؤنَّث | مؤنَّث | أَبِيل | أُبْل | فَعِيْل | فُعْل |
ءبل | اسم جمع | اسم | مؤنَّث | مؤنَّث | إِبِل | آبَال | فِعِل | أَفْعَال |
ءبل | اسم مكان | اسم | مؤنَّث | مؤنَّث | مَأْبَلَة | مَآبِل | مَفْعَلَة | مَفَاعِل |
Lien pour télécharger le fichier excel
Voici la requête sql, je t'ai mis quelques commentaires :
- Code:
select distinct r.root, t.type as SingularType, tp.type as PluralType ,
g.gender as SingularGender, gp.gender as PluralGender,
dns.vocalizedNoun AS SingularNoun, dnp.vocalizedNoun as PluralNoun,
pat.pattern as SingularNounPattern, patp.pattern as PluralNounPattern
from plural as plu
inner join dbo.semanticnoun as sn on sn.semanticnounId = plu.singularNounId --nom dérivé singulier
inner join dbo.derivednoun as dns on dns.derivedNounId = sn.derivednounId --nom dérivé singulier
inner join dbo.type as t on t.typeId = dns.typeId --type singulier
inner join dbo.gender as g on g.genderId = dns.genderId -- genre singulier
inner join dbo.root as r on r.rootId = dns.rootId --root du singulier
inner join dbo.pattern as pat on pat.patternId = dns.patternId --pattern singulier
inner join dbo.semanticnoun as sns on sns.semanticnounId = plu.pluralNounId --nom dérivé pluriel
inner join dbo.derivednoun as dnp on dnp.derivedNounId = sns.derivednounId --nom dérivé pluriel
inner join dbo.pattern as patp on patp.patternId = dnp.patternId --pattern pluriel
inner join dbo.type as tp on tp.typeId = dnp.typeId --type pluriel
inner join dbo.gender as gp on gp.genderId = dnp.genderId -- genre pluriel
--inner join dbo.number as n on n.numberId = dnp.numberId
where plu.pluralTypeId = 1 --جمع تكسير pluriel brisé
Adel Medine- Messages : 643
Points : 655
Date d'inscription : 09/09/2013
Page 61 sur 90 • 1 ... 32 ... 60, 61, 62 ... 75 ... 90
Sujets similaires
» قاموس البحث العلميّ / Tous types de dictionnaires arabes en ligne ou à télécharger
» De la synonymie à la traduction ou comment améliorer les dictionnaires bilingues arabes
» Littérature arabe : livres / Arabic Literature: books
» Dictionnaires / معجم / dictionaries
» Dictionnaires latins / قواميس لاتينية / Latin dictionaries
» De la synonymie à la traduction ou comment améliorer les dictionnaires bilingues arabes
» Littérature arabe : livres / Arabic Literature: books
» Dictionnaires / معجم / dictionaries
» Dictionnaires latins / قواميس لاتينية / Latin dictionaries
Page 61 sur 90
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum
|
|