ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

GSOC 2019: Ανοιχτού κώδικα Εξαγωγή Γλωσσικών xαρακτηριστικών από Κείμενα

Του Παναγιώτη Παπαντωνάκη Στα πλαίσια του Google Summer of Code 2019 αναπτύχθηκε ένα πρόγραμμα Windows για την εξαγωγή γλωσσικών χαρακτηριστικών από αρχεία κειμένου με τίτλο Development of a Tool for Extracting Quantitative Text Profiles. Περιγραφή Ένα σημαντικό μέρος των μεγάλων δεδομένων (big data), που διακινείται καθημερινά στο διαδίκτυο, αποτελείται από κείμενα. Από απλά tweets και … Read more

GSOC2019 Δημιουργία ελληνικού μορφολογικού λεξικού

Περιγραφή Ένα μορφολογικό λεξικό είναι ένας πολύ σημαντικός γλωσσικός πόρος για την επεξεργασία φυσικής γλώσσας (NLP). Επιτρέπει για παράδειγμα τη δημιουργία υπολογιστικών λεξικών για την εύρεση του λήμματος και του μέρους του λόγου μίας λέξης. Περιγραφή του λεξικού Το λεξικό δημιουργήθηκε μετά από αυτόματη ανάλυση των άρθρων στο ελληνικό Βικιλεξικό. Για κάθε λεκτικό τύπο (word … Read more

Upgrade UMLGraph with Java’s new doclet API

Η Ενοποιημένη Γλώσσα Σχεδίασης Προτύπων – Unified Modeling Language (UML) παρέχει μια σειρά από διαφορετικούς τύπους διαγραμμάτων για την περιγραφή όλων των πτυχών ενός προγράμματος. Ο προγραμματιστής ή ο σχεδιαστής έρχεται συχνά αντιμέτωπος με την ανάγκη για ανάπτυξη τέτοιων διαγραμμάτων σε ηλεκτρονική μορφή ενώ ταυτόχρονα αναζητά έξυπνα εργαλεία απεικόνισης. Τα διασημότερα σχεδιαστικά εργαλεία απαιτούν τη … Read more

Ανωνυμοποίηση ευαίσθητων δεδομένων σε αρχεία ODT και κειμένου στα Ελληνικά

Στο πλαίσιο του προγράμματος Google Summer Of Code 2019 και υπό την εποπτεία της ΕΕΛΛΑΚ αναπτύχθηκε το odt_anonymizer . Μετά τις αλλαγές που επέφερε ο GDPR, ήταν σημαντικό να δημιουργηθεί ένα μέσο για την εύκολη και ασφαλή ανωνυμοποίηση των δεδομένων βάσει των νέων αλλαγών. Το έργο χωρίστηκε σε 3 τμήματα. Τη δημιουργία ενός προγράμματος ανωνυμοποίησης, … Read more

Σύστημα ανοιχτού κώδικα εκφώνησης email στα Ελληνικά με εξατομικευμένη εκπαίδευση ακουστικών/γλωσσικών μοντέλων

Περιγραφή Στη σημερινή εποχή, η επικοινωνία μέσω email είναι ένα καθημερινό φαινόμενο, το οποίο απαιτεί αρκετό χρόνο, ειδικά από ανθρώπους που δεν είναι «εκπαιδευμένοι» στην πληκτρολόγηση. Έτσι, μια υπηρεσία όπου ο χρήστης θα εκφωνεί το email του αντί να το γράφει θα ήταν πολύ χρήσιμη. Η υλοποίηση, όμως, ενός τέτοιου open-source συστήματος για τα Ελληνικά … Read more