Apprendre les langues arabe et française
Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.
-44%
Le deal à ne pas rater :
Casque Gamer sans fil STEELSERIES Arctis 7P+ (PS5/PS4, PC)
86.99 € 155.01 €
Voir le deal

Projet de dictionnaires arabes

4 participants

Page 61 sur 90 Précédent  1 ... 32 ... 60, 61, 62 ... 75 ... 90  Suivant

Aller en bas

Projet de dictionnaires arabes - Page 61 Empty Re: Projet de dictionnaires arabes

Message par Adel Medine Mar 28 Oct - 23:05

Oui j'ai utilisé le mot clef sql UNION ALL pour avoir les racines des 3 tables (2 tables nouns et verbs du premiers dico + 1 table root du second dico) 
Si tu te formes en sql regarde y les prédicats standard comme order by, group by, distinct etc

Autrement il y a des problèmes dans l'import de semanticnoun. Est-ce que tu veux vérifier que le chiffre final correspond bien au nombre de lignes ? Parce qu'apparemment il y  a des trous, il manque ici le 80690 que je ne retrouve pas
Code:

(80689,132340,13722,N'S',0)  
 (80702,132351,0,N'S',0)
 (80691,132341,13960,N'S',0)  

Encore ici le 80697 et un lien 0 vers derivednoun qui est invalide car le premier derivednoun commence avec le numéro 1
Code:
(80695,132345,14583,N'S',0)
 (80696,132346,14676,N'S',0)
 (80701,132350,0,N'S',0)
 (80698,132347,14929,N'S',0)
 (80699,132348,14930,N'S',0)
 (80700,132349,15306,N'S',0)
 (80703,132352,16865,N'S',0)
 (80704,132353,18109,N'S',0)
Ce qui fait 2 liens inexistants. Remarque aussi la ligne avec le 0 pour le 80701, c'est sensé être un lien vers le numéro de ligne de derivednoun hors celui-ci commence à 1 soit un lien de premier niveau en moins.
Code:
(80702,132351,0,N'S',0)
(80701,132350,0,N'S',0)
2 autres encore avec le 0 soit 5 au total de ce que j'ai retrouvé. Ce que j'observe dans ma base c'est qu'il me manque 188 lignes. 

C'est valable aussi avec semanticverb et cela se répercute donc automatiquement sur assimilatedadjective par exemple.

Donc il va y avoir une certaine perte de données au final pour commencer.

Adel Medine

Messages : 643
Points : 655
Date d'inscription : 09/09/2013

Revenir en haut Aller en bas

Projet de dictionnaires arabes - Page 61 Empty Re: Projet de dictionnaires arabes

Message par Ibn Nacer Mer 29 Oct - 19:13

السلام عليكم ورحمة الله وبركاته

Oui je vois aussi qu'il manque certains numéros...

Si on ne peut pas récupérer toutes les infos est-ce qu'au moins celles qui sont récupérées sont fiables (malgré les erreurs qui empêchent de récupérer toute les infos) ?

Adel Medine a écrit:Tu disais que ces 2 dicos étaient les plus gros mais ne représentent qu'environ "que" 10 000 racines pour environ 100 000 mots ?  

On sait combien de racines et de mots contient le lane lexicon et de manière générale la langue arabe et le Coran ?

La deuxième base recense 6900 racines c'est le plus grand nombre que j'ai vu jusqu'à maintenant mais c'est vrai qu'il faudrait voir ce qu'il en est du Lane's lexicon et du Kasimirski. Dans le معجم اللغة العربية المعاصرة il semble y en avoir 5778 (certaines ne sont vraiment des racines).

Ibn Nacer

Messages : 1990
Points : 2234
Date d'inscription : 04/09/2011

Revenir en haut Aller en bas

Projet de dictionnaires arabes - Page 61 Empty Re: Projet de dictionnaires arabes

Message par Adel Medine Ven 31 Oct - 12:36

Salâm

Oui les données récupérées sont fiables. Je ne peux juste pas récupérer les données fausses ou inexistantes dans le script de départ.
Les schèmes sont indiqués mais est-ce que serait possible d'ajouter le nombre en plus genre forme I, II, III... ? Et en plus pour la forme I, rajouter la porte uu, ai, aa...

L'association est facile je peux la donner inchâ-a Allâh.
Je n'ai pas encore regardé où se trouvent les informations sur le numéro de la forme et de la porte du verbe. Elles sont dans la table pattern ?
Est-ce possible de fusionner les deux listes en mettant les verbes d’abord et les noms ensuite et ceux pour chaque racine ?
C'est normalement possible avec 2 listes qui ont les mêmes colonnes mais pour le verbe on peut avoir des colonnes que le nom n'a pas (ex : assimilatedadjective, gerund aussi il me semble) du coup j’exclurais ces colonnes pour fusionner les 2 listes ou mettrais une valeur vide pour le nom.

Pour le formatage cela risque par contre d'être plus complexe en sql finalement. Je vais te fournir quelque chose comme cela pour les singuliers avec leurs pluriels brisés:

singulier 1, pluriel brisé 1.1, root, pattern singulier, pattern pluriel, gender
singulier 1, pluriel brisé 1.2, root, pattern  singulier, pattern pluriel, gender
singulier 2, pluriel brisé 2.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.2, root, pattern singulier, pattern pluriel, gender
etc..
Le root n'apparaît qu'une fois car je considère qu'il est le même pour le singulier ou le pluriel. Par contre on voit qu'il y a autant de lignes que de couples singulier/pluriel. Il n'y a pas une seule ligne pour un singulier avec tous ces pluriels en colonnes. (on pourrait mais cela me prendrait plus de temps en sql)

Même problème de formatage pour avoir tous les noms et verbes avec leurs meanings. (mettre le dico à plat)

nom 1, root, pattern, meaning 1
nom 1, root, pattern, meaning 2
nom 1, root, pattern, meaning 3
nom 2, root, pattern, meaning 1
nom 2, root, pattern, meaning 2
nom 2, root, pattern, meaning 3
verbe 1, root, pattern, meaning 1
verbe 1, root, pattern, meaning 2
verbe 1, root, pattern, meaning 3
verbe 2, root, pattern, meaning 1
verbe 2, root, pattern, meaning 2
verbe 2, root, pattern, meaning 3

Adel Medine

Messages : 643
Points : 655
Date d'inscription : 09/09/2013

Revenir en haut Aller en bas

Projet de dictionnaires arabes - Page 61 Empty Re: Projet de dictionnaires arabes

Message par Ibn Nacer Ven 31 Oct - 18:46

Adel Medine a écrit:Salâm

Oui les données récupérées sont fiables. Je ne peux juste pas récupérer les données fausses ou inexistantes dans le script de départ.
وعليكم السلام ورحمة الله وبركاته

Ah bah tant mieux c'est déjà ça al hamduliLlâh.

Adel Medine a écrit:Je n'ai pas encore regardé où se trouvent les informations sur le numéro de la forme et de la porte du verbe. Elles sont dans la table pattern ?
Oui c'est ça.

Adel Medine a écrit:C'est normalement possible avec 2 listes qui ont les mêmes colonnes mais pour le verbe on peut avoir des colonnes que le nom n'a pas (ex : assimilatedadjective, gerund aussi il me semble) du coup j’exclurais ces colonnes pour fusionner les 2 listes ou mettrais une valeur vide pour le nom.
Ok.

Adel Medine a écrit:Pour le formatage cela risque par contre d'être plus complexe en sql finalement. Je vais te fournir quelque chose comme cela pour les singuliers avec leurs pluriels brisés:

singulier 1, pluriel brisé 1.1, root, pattern singulier, pattern pluriel, gender
singulier 1, pluriel brisé 1.2, root, pattern singulier, pattern pluriel, gender
singulier 2, pluriel brisé 2.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.1, root, pattern singulier, pattern pluriel, gender
singulier 3, pluriel brisé 3.2, root, pattern singulier, pattern pluriel, gender
etc..
Le root n'apparaît qu'une fois car je considère qu'il est le même pour le singulier ou le pluriel. Par contre on voit qu'il y a autant de lignes que de couples singulier/pluriel. Il n'y a pas une seule ligne pour un singulier avec tous ces pluriels en colonnes. (on pourrait mais cela me prendrait plus de temps en sql)

Même problème de formatage pour avoir tous les noms et verbes avec leurs meanings. (mettre le dico à plat)

nom 1, root, pattern, meaning 1
nom 1, root, pattern, meaning 2
nom 1, root, pattern, meaning 3
nom 2, root, pattern, meaning 1
nom 2, root, pattern, meaning 2
nom 2, root, pattern, meaning 3
verbe 1, root, pattern, meaning 1
verbe 1, root, pattern, meaning 2
verbe 1, root, pattern, meaning 3
verbe 2, root, pattern, meaning 1
verbe 2, root, pattern, meaning 2
verbe 2, root, pattern, meaning 3
Ok c'est bien aussi comme ça.

Bâraka Allâhu fîka.

Ibn Nacer

Messages : 1990
Points : 2234
Date d'inscription : 04/09/2011

Revenir en haut Aller en bas

Projet de dictionnaires arabes - Page 61 Empty Re: Projet de dictionnaires arabes

Message par Adel Medine Ven 31 Oct - 20:33

Salam
Oui c'est ça. 
Tu as bien vérifié avant ? Parce qu'il n'y a pas cette info dans la table pattern ni ailleurs apparemment..
Ok c'est bien aussi comme ça.
Sinon tu le voyais présenté comment autrement dans un tableur ? 

Voici un exemple pour la requête des singuliers avec leurs pluriels brisés Il y a en tout 11 942 lignes.
rootsingular typeplural typesingular genreplural genresingular nounplural nounsingular patternplural pattern
ءبداسماسممؤنَّثمؤنَّثآبِدَةأَوَابِدفَاعِلَةفَوَاعِل
ءبداسماسممذكَّرمذكَّرأَبَدآبَادفَعَلأَفْعَال
ءبداسماسممذكَّرمذكَّرأَبَدأُبُودفَعَلفُعُوْل
ءبراسماسممؤنَّثمذكَّرمِئْبَرَةمَآبِرمِفْعَلَةمَفَاعِل
ءبراسماسممذكَّرمذكَّرأَبُورأُبُرفَعُولفُعُل
ءبراسم آلةاسممؤنَّثمؤنَّثإِبْرةإِبَرفِعْلَةفِعَل
ءبراسم آلةاسممؤنَّثمؤنَّثإِبْرَةإِبَرفِعْلَةفِعَل
ءبراسم آلةاسممؤنَّثمذكَّرإِبْرةإِبَارفِعْلَةفِعَال
ءبراسم آلةاسممؤنَّثمذكَّرإِبْرَةإِبَارفِعْلَةفِعَال
ءبراسم آلةاسممذكَّرمذكَّرمِئْبَرمَآبِرمِفْعَلمَفَاعِل
ءبراسم مكاناسممذكَّرمذكَّرمَأْبَرمَآبِرمَفْعَلمَفَاعِل
ءبزماسم آلةاسممذكَّرمذكَّرإِبْزِيمأًبازيمفِعْلِيلفَعَالِيل
ءبزناسماسممذكَّرمذكَّرأَبْزَنأَبازِنفَعْلَلفَعَالِل
ءبضاسماسممذكَّرمذكَّرإِبَاضأُبُضفِعَالفُعُل
ءبضاسماسممذكَّرمذكَّرأَبُوضأُبُضفَعُولفُعُل
ءبضاسماسممذكَّرمذكَّرمَأْبِضمَآبِضمَفْعِلمَفَاعِل
ءبطاسماسممذكَّرمذكَّرإِباطأُبُطفِعَالفُعُل
ءبطاسماسممذكَّر ومؤنَّثمذكَّر ومؤنَّثإِبِطآبَاطفِعِلأَفْعَال
ءبطاسماسممذكَّر ومؤنَّثمذكَّر ومؤنَّثإِبْطآبَاطفِعْلأَفْعَال
ءبلاسماسممؤنَّثمؤنَّثإِبَالَةأَبَائِلفِعَالةفَعَائِل
ءبلاسماسممؤنَّثمؤنَّثأَبِيلآبَالفَعِيْلأَفْعَال
ءبلاسماسممؤنَّثمؤنَّثأَبِيلأُبْلفَعِيْلفُعْل
ءبلاسم جمعاسممؤنَّثمؤنَّثإِبِلآبَالفِعِلأَفْعَال
ءبلاسم مكاناسممؤنَّثمؤنَّثمَأْبَلَةمَآبِلمَفْعَلَةمَفَاعِل
En dehors du sens(table meaning) et ce qui s'y rattache(source, example..), il y a d'autres informations qui sont possibles à récupérer et qui sont en liens avec chaque couple singulier/pluriel.(ex : région, nombre,semantic scope, etc..)

Lien pour télécharger le fichier excel


Voici la requête sql, je t'ai mis quelques commentaires :
Code:
select distinct r.root, t.type as SingularType, tp.type as PluralType ,
            g.gender as SingularGender, gp.gender as PluralGender,
            dns.vocalizedNoun AS SingularNoun, dnp.vocalizedNoun as PluralNoun,
            pat.pattern as SingularNounPattern, patp.pattern as PluralNounPattern               
from plural as plu
inner join dbo.semanticnoun as sn on sn.semanticnounId = plu.singularNounId --nom dérivé singulier
inner join dbo.derivednoun as dns on dns.derivedNounId = sn.derivednounId --nom dérivé singulier
inner join dbo.type as t on t.typeId = dns.typeId --type singulier
inner join dbo.gender as g on g.genderId = dns.genderId -- genre singulier
inner join dbo.root as r on r.rootId = dns.rootId --root du singulier
inner join dbo.pattern as pat on pat.patternId = dns.patternId --pattern singulier
inner join dbo.semanticnoun as sns on sns.semanticnounId = plu.pluralNounId --nom dérivé pluriel
inner join dbo.derivednoun as dnp on dnp.derivedNounId = sns.derivednounId --nom dérivé pluriel
inner join dbo.pattern as patp on patp.patternId = dnp.patternId --pattern pluriel
inner join dbo.type as tp on tp.typeId = dnp.typeId --type pluriel
inner join dbo.gender as gp on gp.genderId = dnp.genderId -- genre pluriel
--inner join dbo.number as n on n.numberId = dnp.numberId
where   plu.pluralTypeId = 1 --جمع تكسير  pluriel brisé

Adel Medine

Messages : 643
Points : 655
Date d'inscription : 09/09/2013

Revenir en haut Aller en bas

Projet de dictionnaires arabes - Page 61 Empty Re: Projet de dictionnaires arabes

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Page 61 sur 90 Précédent  1 ... 32 ... 60, 61, 62 ... 75 ... 90  Suivant

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum