ΚΕΦΑΛΑΙΟ 5 - Έμπειρα Συστήματα
Σύνοψη
Στο κεφάλαιο αυτό παρουσιάζεται η μηχανική συστημάτων βασισμένων στη γνώση με βασικό εκπρόσωπό τους τα Έμπειρα Συστήματα Βασισμένα σε Κανόνες (Rule-Based Expert Systems). Παρουσιάζονται η δομή και η λειτουργία τους, η συγκέντρωση και μηχανική της γνώσης, καθώς και περιπτώσεις εφαρμογών τους. Ιδιαίτερη περίπτωση είναι η μηχανική της αβέβαιης και ασαφούς γνώσης που παρουσιάζεται στο τέλος του κεφαλαίου με μικρά παραδείγματα.
Προαπαιτούμενη γνώση
Αναπαράσταση γνώσης, Συστήματα Κανόνων.
5.1 Γενικά
Ένα Έμπειρο Σύστημα-ΕΣ (Expert System - ES) είναι εξ ορισμού ένα σύστημα το οποίο προσπαθεί να επιδείξει ικανότητες στο να λαμβάνει αποφάσεις παρόμοιες με αυτές ενός ειδήμονα (εμπειρογνώμονα) σε ένα γνωστικό τομέα. Πιο απλά, ένα ΕΣ είναι διαλογικό μηχανογραφικό εργαλείο σχεδιασμένο να λύνει δύσκολα προβλήματα λήψης αποφάσεων τα οποία βασίζονται σε γνώση συγκεντρωμένη από ειδήμονες. Υπό αυτό το πρίσμα, ένα ΕΣ αναμένεται να ενεργεί σε όλα του τα σημεία παρόμοια με τον τρόπο με τον οποίο θα ενεργούσε ένας ειδήμονας.
Τα ΕΣ είναι κλάδος της ΤΝ που υπάγεται στο γενικότερο σχήμα των Συστημάτων Βασισμένων στη Γνώση-ΣΒΓ (Knowledge Based Systems - KBS). Η διαφορά των ΕΣ από τα ΣΒΓ είναι ότι τα πρώτα περιέχουν ειδική γνώση, ενώ τα δεύτερα γενική γνώση ενός συγκεκριμένου κόσμου.
Σχήμα 5.1 Η θέση των Εμπείρων Συστημάτων στο χώρο της Τεχνητής Νοημοσύνης
Τα ΕΣ μπορούν να διαχωριστούν από τα άλλα συστήματα του χώρου στο ότι:
- Εξετάζουν προβλήματα ρεαλιστικής περιπλοκότητας τα οποία απαιτούν να αξιοποιηθεί σεβαστό απόθεμα ανθρώπινης εμπειρίας.
- Πρέπει να είναι ικανά για αξιολόγηση, επεξήγηση και δικαιολόγηση λύσεων, καθώς και παροχή συμβουλών, για να πειστεί ο χρήστης.
- Πρέπει να είναι γρήγορα και αξιόπιστα, ώστε να είναι χρήσιμα ως εργαλεία.
Για να σχεδιαστεί ένα ΕΣ, δύο είναι τα βασικά βήματα: η απόκτηση της απαραίτητης γνώσης για το προς επίλυση πρόβλημα και η αναπαράστασή της (βλέπε κεφάλαιο 2).
Απόκτηση γνώσης (knowledge acquisition) καλείται η εξειδικευμένη γνώση που πρέπει να προσκτηθεί σε σχέση με:
- τα γεγονότα που περιγράφουν τον κόσμο του προβλήματος,
- τις «εμπειρικές γνώσεις» που συσσωρεύει ένας ειδικός κατά την πάροδο των ετών που ασχολείται με το πρόβλημα.
5.2 Η Δομή ενός ΕΣ Βασισμένου σε Κανόνες
Η δομή των Έμπειρων Συστημάτων Βασισμένων σε Κανόνες-ΕΣΒΚ (Rule-Based Expert Systems-RBES) βασίζεται στο μοντέλο συστήματος παραγωγής (production system model), το οποίο πρότειναν οι γνωστοί επιστήμονες του χώρου της ΤΝ Newell και Simon από το Πανεπιστήμιο Carnegie-Mellon στις αρχές της δεκαετίας του ’70.
Το μοντέλο συστήματος παραγωγής βασίζεται στην ιδέα ότι οι άνθρωποι λύνουν προβλήματα εφαρμόζοντας τη γνώση τους σε δεδομένο πρόβλημα που παρουσιάζεται μέσω πληροφοριών που αφορούν τα δεδομένα του∙ η γνώση αποθηκεύεται στη μνήμη μακράς διάρκειας (long-term memory) και οι πληροφορίες στη μνήμη μικρής διάρκειας (short-term memory) (βλέπε Σχήμα 5.2).
Σχήμα 5.2 Μοντέλο συστήματος παραγωγής
Μια τυπική δομή ενός ΕΣ, επιτελείται από:
- τη Βάση Δεδομένων (DataBase) ή Μνήμη Εργασίας (Working Memory) στο ρόλο της μνήμης μικρής διάρκειας,
- τη Βάση Κανόνων (RuleBase) ή Βάση Γνώσης (KnowledgeBase) ή Παραγωγική Μνήμη (Productive Memory) στο ρόλο της μνήμης μακράς διάρκειας,
- Το Μηχανισμό Εξαγωγής Συμπερασμάτων (Inference Mechanism) ή Συμπερασματική Μηχανή (Inference Engine) στο ρόλο της Συλλογιστικής.
- Το Τμήμα Διεπαφής (Interface) που επιτρέπει την επικοινωνία μεταξύ του χρήστη και του ΕΣ.
Επιπλέον χαρακτηριστικό στοιχείο της δομής είναι το Τμήμα Επεξηγήσεων (Explanations Facilities).
Σχήμα 5.3 Τυπική δομή ενός ΕΣ
Δείτε κινούμενη εικόνα 5.1 - Επικοινωνία μεταξύ των τμημάτων ενός ΕΣ
Στη Βάση Κανόνων, το πεδίο γνώσης που είναι χρήσιμο για την επίλυση του προβλήματος παρουσιάζεται ως ένα σύνολο κανόνων. Κάθε κανόνας ορίζει μια σχέση, σύσταση ή οδηγία. Όταν πληρούνται οι υποθέσεις του μέρους ΑΝ ενός κανόνα, ο κανόνας αυτός τοποθετείται από τη δομή ελέγχου στο σύνολο σύγκρουσης και, αν κατά την επίλυση συγκρούσεων επιλεγεί ο συγκεκριμένος κανόνας, τότε ενεργοποιείται και εκτελούνται οι ενέργειες του μέρους ΤΟΤΕ εκτελούνται (βλέπε κεφάλαιο 3).
Η Βάση Δεδομένων περιλαμβάνει σε κάθε στιγμιότυπο εκτέλεσης ένα σύνολο γεγονότων που ισχύουν το συγκεκριμένο στιγμιότυπο. Η δομή ελέγχου συγκρίνει τα γεγονότα με τις υποθέσεις του μέρους ΑΝ των κανόνων κατά τη σύγκριση προτύπων που πραγματοποιεί στην αρχή κάθε κύκλου εκτέλεσης του ΕΣ.
Η Συμπερασματική Μηχανή πραγματοποιεί τη συλλογιστική σύμφωνα με την οποία το ΕΣ φθάνει σε μια λύση. Ειδικότερα, χρησιμοποιείται από το σύστημα για να δικαιολογήσει ή να συναγάγει συμπεράσματα όπως θα ενεργούσε ένας ειδήμονας, δεδομένων παρόμοιων συνθηκών. Ο ρόλος της είναι να ξέρει πότε και πώς να εφαρμόζει την έως τώρα αποθηκευμένη γνώση με τη βοήθεια της δομής ελέγχου που διαθέτει, για να συνδέει τους κανόνες στη Βάση Κανόνων με τα γεγονότα στη Βάση Δεδομένων και να εκτελεί κανόνες με ικανοποιημένους ισχυρισμούς βάσει στρατηγικών και ευρετικών λειτουργιών που περιέχονται στους κανόνες ή δηλώνονται εξωτερικά πριν από την εκτέλεση του ΕΣ.
Η Τμήμα Διεπαφής είναι το μέσο επικοινωνίας μεταξύ των χρηστών που αναζητούν μια λύση στο πρόβλημα και ενός ΕΣ.
Το Τμήμα Επεξηγήσεων επιτρέπει στο χρήστη να ζητήσει από το ΕΣ να του παρουσιάσει μέσω της διεπαφής πώς κατέληξε σε ένα συγκεκριμένο συμπέρασμα και γιατί χρειάζεται ένα συγκεκριμένο γεγονός. Ένα ΕΣ πρέπει να είναι σε θέση να εξηγήσει το σκεπτικό του και να δικαιολογήσει τις συμβουλές, την ανάλυση ή το συμπέρασμά του με τη βοήθεια του ιστορικού που διατηρεί για την πυροδότηση των κανόνων.
5.3 Χαρακτηριστικά ενός ΕΣ
Ένα ΕΣ κατασκευάζεται, για να λειτουργεί σε ένα στενό, εξειδικευμένο τομέα. Έτσι, το πιο σημαντικό χαρακτηριστικό του είναι η υψηλής ποιότητας απόδοσή του. Είναι προβληματικό αν το σύστημα λύσει ένα πρόβλημα γρήγορα, αλλά ο χρήστης δεν μείνει ικανοποιημένος σε περίπτωση κατά την οποία το αποτέλεσμα είναι λάθος. Ωστόσο, η ταχύτητα της επίτευξης μιας λύσης είναι πολύ σημαντική. Ακόμη και η πιο ακριβής απόφαση ή διάγνωση δεν μπορεί να είναι χρήσιμη, αν, όταν βρεθεί, είναι πολύ αργά για να εφαρμοστεί.
Τα ΕΣ εφαρμόζουν ευρετικούς μηχανισμούς (heuristics), για να καθοδηγήσουν τη συλλογιστική που ακολουθούν και να μειώσουν την περιοχή αναζήτησης μιας λύσης. Διαθέτουν, όμως, και ένα μοναδικό χαρακτηριστικό, το οποίο είναι η ικανότητά τους να εξηγούν τις αποφάσεις τους.
Τα ΕΣ χρησιμοποιούν συμβολική λογική κατά την επίλυση ενός προβλήματος. Τα σύμβολα χρησιμοποιούνται για να αντιπροσωπεύουν διαφορετικούς τύπους γνώσης, όπως γεγονότα, έννοιες και κανόνες με βάση τη γνώση που έχουν δοθεί από έναν ειδήμονα. Όμως, ακόμη και ο πιο ευφυής ειδικός τομέα είναι μόνο ένας άνθρωπος και μπορεί να κάνει λάθη. Και τα ΕΣ που δομούνται από τη γνώση των ειδικών πρέπει, επίσης, να έχουν τη δυνατότητα να κάνουν λάθη. Πρέπει να λαμβάνουμε υπόψη μας ότι στα ΕΣ τα λάθη είναι πιθανά, αν και στις περισσότερες, τουλάχιστον, περιπτώσεις μπορούμε να βασιστούμε σε λύσεις τις οποίες παρέχουν, όπως και οι αποφάσεις των ειδικών μπορεί να είναι εσφαλμένες, ακόμη και αν έχουμε εμπιστοσύνη σε αυτούς.
Στα ΕΣ, η γνώση χωρίζεται από την επεξεργασία της (η επεξεργασία της Βάσης Γνώσης και της Συμπερασματικής Μηχανής είναι διαχωρισμένη). Όταν χρησιμοποιείται ένα κέλυφος έμπειρου συστήματος (expert system shell), ένας μηχανικός γνώσης ή ένας εμπειρογνώμονας εισάγει απλώς τους κανόνες στη βάση γνώσης. Κάθε νέος κανόνας προσθέτει κάποια νέα γνώση και κάνει το ΕΣ πιο νοήμον. Αντίθετα, ένα συμβατικό πρόγραμμα είναι μείγμα της γνώσης και της δομής ελέγχου για την επεξεργασία αυτής της γνώσης. Η ανάμειξη προκαλεί δυσκολίες στην κατανόηση και την αναθεώρηση του κώδικα του προγράμματος, καθώς οποιαδήποτε αλλαγή στον κώδικα επηρεάζει τόσο τη γνώση όσο και την επεξεργασία της.
Η παραπάνω διαφορά μεταξύ ενός ΕΣ και ενός συμβατικού προγράμματος δεν είναι η μοναδική. Γενικά, οι διαφορές πηγάζουν από το ότι ένα ΕΣ αποτελείται από το τμήμα μηχανικής της γνώσης και τη Συμπερασματική Μηχανή, ενώ ένα συμβατικό πρόγραμμα αποτελείται από την κωδικοποίηση των δεδομένων του και τον αλγόριθμό του:
Έμπειρο Σύστημα = Γνώση + Συμπερασματική Μηχανή
Πρόγραμμα = Δεδομένα + Αλγόριθμος
Στον παρακάτω πίνακα 5.1 αποτυπώνονται οι βασικότερες διαφορές μεταξύ των δυο τύπων λογισμικού.
Πίνακας 5.1 Βασικές διαφορές μεταξύ ΕΣ και συμβατικών προγραμμάτων
5.4 Ανάπτυξη ενός ΕΣ
Υπάρχουν 5 κατηγορίες συμμετεχόντων σε μια ομάδα ανάπτυξης ενός ΕΣ:
- Ο ειδικός του τομέα ενδιαφέροντος,
- Ο μηχανικός γνώσης,
- Ο προγραμματιστής,
- Ο διαχειριστής του έργου,
- Ο τελικός χρήστης.
Η επιτυχία του υπό δημιουργία ΕΣ εξαρτάται ολοκληρωτικά από το πόσο καλά συνεργάζονται τα μέλη της ομάδας ανάπτυξης. Στο σχήμα 5.4 παρουσιάζονται οι συμμετέχοντες στην ομάδα ανάπτυξης του ΕΣ.
Σχήμα 5.4 Οι συμμετέχοντες στην ομάδα ανάπτυξης ενός ΕΣ
Ο ειδικός τομέα (domain expert) είναι ένα πρόσωπο με γνώσεις και δεξιότητες ικανό να λύνει προβλήματα σε μια συγκεκριμένη περιοχή ή τομέα. Στο δεδομένο τομέα πρέπει να διαθέτει τη μεγαλύτερη εμπειρία, η οποία πρέπει να αποτυπωθεί στο ΕΣ. Ως εκ τούτου, ο ειδικός πρέπει να είναι ικανός:
- να επικοινωνεί τη γνώση του/της,
- να είναι πρόθυμος/η να συμμετέχει στην ομάδα ανάπτυξης και
- να διαθέτει τον απαιτούμενο χρόνο για το σκοπό αυτό.
Ο ειδικός τομέα είναι το πιο σημαντικό πρόσωπο της ομάδας ανάπτυξης.
Ο μηχανικός γνώσης (knowledge engineer) είναι αυτός που θα σχεδιάσει, θα κατασκευάσει και θα ελέγξει το ΕΣ. Συνεργάζεται με τον ειδικό τομέα, για να μάθει πώς λύνεται το συγκεκριμένο πρόβλημα. Αναγνωρίζει ποια συλλογιστική χρησιμοποιεί ο ειδικός, για να χειριστεί τα γεγονότα και τους κανόνες, και αποφασίζει πώς θα τους αναπαραστήσει στο ΕΣ. Επιλέγει αν θα προχωρήσει σε ανάπτυξη λογισμικού ή θα χρησιμοποιήσει ένα κέλυφος ΕΣ , αναζητεί κατάλληλες γλώσσες προγραμματισμού για την κωδικοποίηση της γνώσης. Είναι υπεύθυνος/η για τον έλεγχο, την αναθεώρηση και την ενσωμάτωση του ΕΣ συστήματος στο χώρο εργασίας.
Ο προγραμματιστής (programmer) είναι υπεύθυνος για τον προγραμματισμό του ΕΣ, περιγράφοντας τις γνώσεις του τομέα με τρόπο κατανοητό από έναν υπολογιστή. Εκτός της γνώσης συμβατικών γλωσσών προγραμματισμού πρέπει να έχει και κάποιες δεξιότητες σε συμβολικό προγραμματισμό σε γλώσσες ΤΝ, όπως LISP και Prolog, καθώς επίσης και κάποια εμπειρία από τη χρήση διαφορετικών τύπων κελυφών ανάπτυξης ΕΣ.
Ο διαχειριστής έργου (project manager) είναι ο ηγέτης της ομάδας ανάπτυξης του ΕΣ, υπεύθυνος για τη διατήρηση της προόδου του έργου. Αυτός/αυτή εξασφαλίζει ότι όλα τα παραδοτέα και τα ορόσημα επιτυγχάνονται, αλληλεπιδρά με τον ειδικό τομέα, το μηχανικό γνώσης, τον προγραμματιστή και τον τελικό χρήστη.
Ο τελικός χρήστης (end user) ή απλά χρήστης χρησιμοποιεί το ΕΣ, καθώς αναπτύσσεται. Ο χρήστης πρέπει και να είναι βέβαιος για την απόδοση του συστήματος και να αισθάνεται άνετα με τη χρήση του. Ως εκ τούτου, και ο σχεδιασμός της διεπαφής χρήστη-ΕΣ είναι ζωτικής σημασίας για την επιτυχία του έργου. Η συνεισφορά του τελικού χρήστη εδώ μπορεί να είναι καθοριστική.
5.5 Απόκτηση Γνώσης
Η Απόκτηση Γνώσης (Knowledge acquisition) είναι η μεταφορά και η μετατροπή μίας εμπειρίας που αφορά τον τρόπο επίλυσης ενός συγκεκριμένου προβλήματος από την πηγή της γνώσης σε ένα πρόγραμμα (Buchanan et al, 1983)∙ περιλαμβάνει, δε, τρεις δραστηριότητες:
- Συγκέντρωση γνώσης,
- Αναπαράσταση γνώσης,
- Κωδικοποίηση γνώσης.
Η αποκτώμενη γνώση μπορεί να περιέχει αβεβαιότητα ή/και ασάφεια, η διαχείριση των οποίων γίνεται με ειδικούς τρόπους.
5.5.1 Συγκέντρωση Γνώσης
Η Συγκέντρωση Γνώσης (Knowledge elicitation) αφορά τη διαδικασία της πρόσκτησης γνώσης από τους ειδικούς τομέα, τα βιβλία, συγγράμματα ή άλλο έντυπο υλικό, από άμεση παρατήρηση των διαδικασιών επίλυσης του προβλήματος από κάποιον ειδήμονα και είναι ένα από τα βασικότερα βήματα για τη δημιουργία ενός ΕΣ. Η συγκέντρωση της γνώσης μπορεί να γίνει και από το ίδιο το σύστημα, το οποίο πολλές φορές έχει τη δυνατότητα παραγωγής νέας γνώσης, οπότε καλείται ευφυές έμπειρο σύστημα (intelligent expert system).
Η γνώση που συγκεντρώνεται συγκροτεί τη Βάση Γνώσης, ένα από τα δυο συστατικά τμήματα των ΕΣ. Το δεύτερο συστατικό τμήμα είναι η Συμπερασματική Μηχανή, για τον τρόπο λειτουργίας της οποίας έχουμε διεξοδικά αναφερθεί στο κεφάλαιο 3, καθώς και σε προηγούμενη παράγραφο του κεφαλαίου αυτού.
Η διαδικασία ανάπτυξης της Βάσης Γνώσης ενός ΕΣ καλείται μηχανική της γνώσης (knowledge engineering) και οι αρμόδιοι γι’ αυτήν μηχανικοί γνώσης είναι, επίσης, υπεύθυνοι για τη συγκέντρωση της γνώσης από τις διάφορες πηγές, καθώς και την αναπαράστασή της σε μορφή γεγονότων (facts) και κανόνων (rules).
Γνώση = Γεγονότα + Κανόνες
Knowledge = Facts + Rules
Όταν η πηγή συγκέντρωσης είναι ο ειδικός πεδίου, τότε απαιτούνται πολλές προσωπικές συναντήσεις με αυτόν. Στις συναντήσεις αυτές συνήθως απαιτούνται μέθοδοι δομημένης συνέντευξης, η οποία εν γένει αποτυπώνεται σε μαγνητικά μέσα, ώστε η λεπτομερής επεξεργασία της να γίνει αργότερα σε ουδέτερο χρόνο. Με τις δομημένες συνεντεύξεις αποτυπώνεται ειδικού τύπου πληροφόρηση για συγκεκριμένες μορφές τεχνικών του ειδήμονα που οι απλή προφορική συνέντευξη δε μπορεί να αποτυπώσει. Μέθοδοι μη δομημένων συνεντεύξεων συνήθως ακολουθούνται στις πρώτες συναντήσεις, κατά το προκαταρτικό στάδιο επαφών, με σκοπό την πιο εύκολη και γρήγορη συγκέντρωση υλικού σχετικού με βασική πληροφόρηση
Για την εύκολη και άμεση άντληση της γνώσης από έναν ειδικό τομέα έχουν αναπτυχθεί πολλά κατάλληλα εξειδικευμένα εργαλεία. Ένα από τα βασικά τους προτερήματα είναι η ευκολία που διαθέτουν, ώστε ο ίδιος ο ειδικός τομέα να συμβάλλει στη ενημέρωση της βάσης γνώσης με την άνεσή του. Τέτοια εργαλεία οδηγούν τον ειδήμονα βήμα προς βήμα για την κατηγοριοποίηση και αποσαφήνιση των γνώσεων τις οποίες πρέπει να μεταδώσει με τέτοιο τρόπο, ώστε να τον βοηθάει να συλλάβει τα στοιχεία της ίδιας του της εμπειρίας. Αφού καταγραφεί η γνώση, οι κανόνες παράγονται αυτόματα.
Άλλο είδος εργαλείων απόκτησης γνώσης είναι τα εργαλεία που παράγουν γνώση επαγωγικά από παραδείγματα (βλέπε κεφάλαιο 4, αλγόριθμοι παραγωγής κανόνων). Τέτοιο λογισμικό παράγει κανόνες βασιζόμενο σε παραδείγματα τα οποία περιέχουν χαρακτηριστικές λύσεις και αντιπροσωπεύουν την υπό αναζήτηση γνώση.
Όσον αφορά την στρατηγική που ακολουθείται για την απόκτηση γνώσης, αυτή είναι η δημιουργία πρωτοτύπου. Παράγεται, δηλαδή, το γρηγορότερο δυνατόν ένα επιδείξιμο σύστημα, για να διατηρηθεί ζωντανό το ενδιαφέρον του πελάτη που το έχει παραγγείλει, ο οποίος βλέποντας γρήγορα ένα αντιπροσωπευτικό σύστημα πιστεύει στη δυνατότητα επίτευξης ενός αξιόλογου τελικού προϊόντος και συνεχίζει να υποστηρίζει την ολοκλήρωση του έργου. Στη πράξη, οι πιο πολλοί μηχανικοί γνώσης χρησιμοποιούν τα γρήγορα πρωτότυπα σε συνδυασμό με συνεντεύξεις και ανάλυση εγγράφων. Εντούτοις, παρουσιάζονται πολλά προβλήματα κυρίως κατά τη φάση της συγκέντρωσης της γνώσης, όπως η χαμηλή ποιότητα της υπό συγκέντρωση γνώσης και προβλήματα σχετικά με τους ειδικούς τομέα: πιο συγκεκριμένα, έλλειψη τρόπων προσέγγισής τους ή επικοινωνίας για μετάδοση της εμπειρίας τους, μη συνεργασία τους.
Όσον αφορά δε το ΕΣ, μπορούμε να πούμε ότι μετά την απόκτηση της γνώσης είναι σχεδόν ολοκληρωμένο, με μόνη εκκρεμότητα τη δημιουργία της διεπαφής που μπορεί να προγραμματιστεί και με άλλα εξειδικευμένα εργαλεία, π.χ. γλώσσες προγραμματισμού κατάλληλες για διαδικτυακές εφαρμογές ή κινητές συσκευές, όταν το ΕΣ λειτουργεί σε τέτοια περιβάλλοντα.
5.6 Αβεβαιότητα
Αβεβαιότητα (Uncertainty) είναι η έλλειψη επαρκούς πληροφόρησης για τη λήψη μίας απόφασης. Μπορεί να οφείλεται σε αβέβαιη γνώση ή αβέβαιη μαρτυρία, η οποία οδηγεί σε αλληλοσυγκρουόμενες λύσεις ή μη ολοκληρωμένη γνώση. Τα ΕΣ πρέπει να διαθέτουν ικανότητες παρόμοιες με εκείνες των ανθρώπων, που είναι ικανοί να εξάγουν αληθή συμπεράσματα αντιμετωπίζοντας αβέβαιη πληροφόρηση. Η ικανότητα αυτή των ειδημόνων βασίζεται στη χρήση απαγωγικής συλλογιστικής σε μορφή ευρετικών κανόνων (heuristics): κανόνων που σχηματίζει ο ειδικός τομέα από συνεχή παρατήρηση παρόμοιων παρελθοντικών καταστάσεων και λύσεων που βρέθηκαν. Παράδειγμα, όταν κάποιος οδηγός βρεθεί σε σταυροδρόμι και δεν ξέρει ποιο δρόμο να ακολουθήσει, συνήθως επιλέγει αυτόν που έχει κατεύθυνση προς το στόχο του, γιατί τις πιο πολλές φορές αυτό έχει αποδειχθεί σωστή επιλογή. Πολλές φορές, οι ειδήμονες χρησιμοποιούν τον ευρετικό τρόπο αιτιολόγησης και ως μία τεχνική επίλυσης προβλημάτων, όταν θέλουν γρήγορα και αποτελεσματικά να φτάσουν σε μία καλή λύση. Όταν χρησιμοποιούνται ευρετικές τεχνικές, η διαδικαστική γνώση περιγράφεται με κανόνες περιορισμένης αποδοχής με τους οποίους μπορεί να δοθεί γρήγορα μία «πιθανή», καλή και αιτιολογημένη λύση. Οι ευρετικές μέθοδοι μπορούν να προσφέρουν μεθόδους που μειώνουν αισθητά το χρόνο επεξεργασίας και το κόστος επίλυσης ενός προβλήματος, αλλά δεν εγγυώνται την εύρεση λύσης, όπως την εγγυάται μια μέθοδος βασισμένη σε βέβαιη γνώση.
Τα ΕΣ είναι ικανά να χειρίζονται τρεις τύπους μη ακριβούς πληροφορίας:
- Αβεβαιότητα που προκύπτει, όταν κάποιος δεν είναι απόλυτα βέβαιος για κάποια πληροφορία∙ παράδειγμα:
Ίσως ο Γιάννης είναι άρρωστος (είναι ή όχι;)
- Ασάφεια που προκύπτει, όταν κάποια πληροφορία δεν είναι σαφώς οριοθετημένη∙ παράδειγμα:
Ο Γιάννης είναι ψηλός (δηλαδή πόσο;)
- Συνδυασμός των δύο προηγούμενων τύπων∙ παράδειγμα:
Ο Γιάννης είναι μάλλον ψηλός (είναι ψηλός και πόσο;)
Τα ΕΣ χρησιμοποιούν διάφορα μοντέλα για τη διαχείριση της μη ακριβούς πληροφορίας, εκ των οποίων γνωστότερα είναι τα ακόλουθα δυο τα οποία αναλύουμε στα επόμενα κεφάλαια:
- Συντελεστές βεβαιότητας,
- Ασαφής λογική.
5.6.1 Συντελεστές Βεβαιότητας
Όταν υπάρχει αβεβαιότητα ως προς την αλήθεια μιας πληροφορίας, χρειάζεται ένας τρόπος για να εκφραστεί το ποσοστό πίστης σε αυτήν. Ένας κατάλληλος τρόπος είναι να υιοθετήσουμε το μοντέλο των συντελεστών βεβαιότητας, το οποίο σε ένα ΕΣ εξετάζει την αβεβαιότητα και στους ισχυρισμούς των κανόνων και την εγκυρότητα των συμπερασμάτων που εξάγονται κατά την εκτέλεσή του.
Πιο αναλυτικά, ένας κανόνας του τύπου [IF <premises> THEN <conclusions>] μπορεί να περιέχει αβεβαιότητα στην ακρίβεια της αλήθειας των γεγονότων που αποτελούν τους ισχυρισμούς του και στην εγκυρότητα των συμπερασμάτων στα οποία καταλήγει. Επιπλέον, όταν ένα ΕΣ περιέχει αβέβαιη γνώση, τότε αβεβαιότητα θα περιέχει και το τελικό συμπέρασμα το οποίο θα εξαγάγει το ΕΣ μετά την αλυσιδωτή εκτέλεση των αβέβαιων κανόνων του.
Στο σχήμα 5.5 παρουσιάζεται ένας κανόνας 100% βέβαιος ως προς την ορθότητα των συμπερασμάτων του (συντελεστής βεβαιότητας 1.0) αλλά 80% βέβαιος ως προς την ακρίβεια της αλήθειας των ισχυρισμών του (συντελεστής βεβαιότητας 0.8). Στην περίπτωση αυτή, δεχόμαστε την εγκυρότητα του κανόνα με την ίδια βεβαιότητα που περιέχεται στους ισχυρισμούς, δηλαδή 80%. Για τον παραπάνω υπολογισμό χρησιμοποιήθηκε το μοντέλο υπολογισμού των συντελεστών βεβαιότητας.
Σχήμα 5.5 Κανόνας με βεβαιότητα 1.0
Στη συνέχεια παρουσιάζεται ολοκληρωμένα ο τρόπος υπολογισμού του βαθμού βεβαιότητας για το αποτέλεσμα ενός ΕΣ που περιέχει αβέβαιη γνώση με βάση το μοντέλο των συντελεστών βεβαιότητας.
Οι συντελεστές βεβαιότητας (certainty factors-CF) χρησιμοποιούνται, για να αναπαραστήσουν βάρη που έχουν καθοριστεί με ευρετικό τρόπο και τα οποία προσδιορίζουν το καθαρό μέτρο εμπιστοσύνης σε μία αξία, γεγονός ή δεδομένο με τιμές μεταξύ -1 και +1. Σε ένα από τα γνωστότερα πρώτο-δημιουργημένα ΕΣ, το MYCIN, ο συντελεστής βεβαιότητας ορίζεται ως εξής:
όπου MB = το μέτρο εμπιστοσύνης (measure of belief)
και MD = το μέτρο της μη εμπιστοσύνης (measure of disbelief).
Τα MB και MD ορίζονται και τα δύο από τους ειδήμονες.
Σε τέτοιου είδους προσεγγίσεις, οι ανεξάρτητοι συντελεστές βεβαιότητας των διαφόρων ισχυρισμών και κανόνων συνδυάζονται, ώστε να καταλήξουν σε κοινό συντελεστή για το συμπέρασμα το οποίο συνάγει το σύστημα. Αυτό είναι ανεπίσημος τρόπος καταμέτρησης της εμπιστοσύνης του ειδικού τομέα και ταιριάζει απόλυτα σε εφαρμογές όπου υπάρχει αβεβαιότητα, αλλά όχι ασάφεια.
Γενικά, κάθε πρόταση ενός μέρους ΑΝ ενός κανόνα μπορεί να έχει το δικό της συντελεστή βεβαιότητας, όπως μπορεί να έχει και κάθε πρόταση του μέρους ΤΟΤΕ του κανόνα. Ο συντελεστής βεβαιότητας της σύζευξης δυο ή περισσότερων ισχυρισμών (Α και Β και ... και Χ) ορίζεται ως ο μικρότερος των συντελεστών των μεμονωμένων ισχυρισμών.
Ο συντελεστής βεβαιότητας μιας διάζευξης δυο ή περισσότερων ισχυρισμών (Α ή Β ή ... ή Υ) ορίζεται ως ο μεγαλύτερος των συντελεστών των μεμονωμένων ισχυρισμών.
Ο συντελεστής βεβαιότητας ενός κανόνα ορίζεται ως ο συντελεστής του μέρους ΑΝ πολλαπλασιασμένος με τον συντελεστή του μέρους ΤΟΤΕ .
Παράδειγμα εφαρμογής συντελεστών βεβαιότητας:
ΑΝ τα φρένα είναι σπασμένα (CF=0.4)
και το τιμόνι δε λειτουργεί (CF=0.2)
ΤΟΤΕ θα γίνει δυστύχημα (CF=0.9)
Δεν επιτρέπεται να ενεργοποιούνται κανόνες με συνολικό συντελεστή βεβαιότητας μικρότερο από μια συγκεκριμένη τιμή, π.χ. 0.2. Έτσι, μειώνεται η πιθανότητα πυροδότησης ακατάλληλων κανόνων που θα οδηγούσε σε μείωση της αποτελεσματικότητας του συστήματος. Στο παράδειγμά μας ο συγκεκριμένος κανόνας δεν πρόκειται να εκτελεστεί λόγω του μικρού συντελεστή βεβαιότητάς του.
Ο συντελεστής βεβαιότητας ενός γεγονότος που παράγεται ως συμπέρασμα ενός κανόνα ή μιας αλυσίδας κανόνων, είναι ο μικρότερος των επιμέρους συντελεστών βεβαιότητας των κανόνων που αποτελούν την αλυσίδα:
Παράδειγμα υπολογισμού συντελεστή βεβαιότητας τελικού συμπεράσματος ΕΣ:
Οι κανόνες που ενεργοποιούνται κατά σειρά είναι :
- ο κανόνας 2 με συντελεστή βεβαιότητας συμπεράσματος (η κεφαλή είναι βρώμικη):
- ο κανόνας 4 με συντελεστή βεβαιότητας συμπεράσματος (καθάρισε την κεφαλή και θα αντιμετωπιστεί το πρόβλημα):
Άρα η βεβαιότητα με την οποία προτείνεται να εφαρμοστεί το τελικό συμπέρασμα του ΕΣ είναι 0.36.
5.7 Ασάφεια
Η αρχή της ασάφειας (fuzziness) δηλώνει ότι τα πάντα είναι ζήτημα βαθμού. Μόνο από τον κόσμο των μαθηματικών έχει εξαλειφθεί η ασάφεια. Το επίσημο επιστημονικό όνομα της ασάφειας είναι πολυτιμία ή πλειοτιμία. Η διτιμία (το άσπρο-μαύρο, ναι-όχι, αληθές-ψευδές) απλουστεύουν τα μαθηματικά και τις διαδικασίες των ηλεκτρονικών υπολογιστών. Όμως, η δίτιμη λογική οδηγεί σε πολλά παράδοξα που μόνο η πολυτιμία μπορεί να αντιμετωπίσει.
Μια διαφορετική προσέγγιση στη διαχείριση της αβεβαιότητας και ειδικότερα της ασαφούς μορφής της είναι η έννοια των ασαφών συνόλων, που πρωτοαναφέρθηκαν από τον Zadeh (1965). Στα παραδοσιακά συστήματα έχουμε σαφώς καθορισμένα περιθώρια∙ για παράδειγμα, τα όρια των ακέραιων αριθμών μεταξύ 3 και 6. Αντίθετα, τα ασαφή σύνολα (fuzzy sets) είναι μια κλάση αντικειμένων με όχι απόλυτα καθορισμένα όρια, π.χ.
Οι ‘Έλληνες είναι κοντοί
Το ερώτημα που τίθεται είναι: ο χαρακτηρισμός ‘κοντός’ τι όρια έχει, όταν αναφέρεται σε Έλληνες και, ακόμα περισσότερο, πώς θα διαμορφώνονταν αυτά τα όρια, αν αναφέρονταν σε κάποιον άλλον λαό, όπως οι Κινέζοι ή οι Νορβηγοί; Παρ’ όλη, όμως, την ελαστικότητα αυτών των ορίων, το νόημα της πρότασης γίνεται σαφώς αντιληπτό.
Η γνώση της ασάφειας συνοψίζεται σε ασαφείς κανόνες (fuzzy rules). Ένας ασαφής κανόνας συσχετίζει ασαφείς έννοιες σε μια μορφή υποθετικών προτάσεων, π.χ.
Εάν η κίνηση είναι πυκνή,
διατήρησε το πράσινο φως περισσότερο χρόνο
Οι προτάσεις κίνηση είναι πυκνή και περισσότερος χρόνος υποδηλώνουν η καθεμία ένα ασαφές σύνολο.
Στην ασαφή λογική (fuzzy logic), τα στοιχεία κάθε συνόλου είναι προσαρτημένα στο σύνολο με βαθμούς συμμετοχής, οι οποίοι προκύπτουν μέσω μιας συνάρτησης συμμετοχής και υποδεικνύουν σε ποια έκταση το κάθε στοιχείο είναι μέρος του συνόλου.
Συνάρτηση συμμετοχής (membership function) καλείται η διασπορά των βαθμών συμμετοχής σε ένα ασαφές σύνολο. Η συνάρτηση συμμετοχής F είναι μια συνάρτηση από ένα χώρο στο διάστημα [0,1], όπου
- F(x)=0 σημαίνει ότι το x δεν είναι στοιχείο του συνόλου,
- F(x)=1 σημαίνει ότι το x είναι οριστικά μέρος του συνόλου,
- όλες οι υπόλοιπες ενδιάμεσες τιμές δείχνουν τους διάφορους βαθμούς συμμετοχής του x στο σύνολο.
Τις περισσότερες φορές οι βαθμοί συμμετοχής καθορίζονται υποκειμενικά από κάποιον ειδικό τομέα.
Ένα από τα στοιχεία της ασαφούς λογικής είναι η έννοια των γλωσσολογικών μεταβλητών, οι οποίες είναι άμεσα εξαρτώμενες από την έννοια που εκπροσωπούν∙ παράδειγμα, η μεταβλητή θερμοκρασία θα μπορούσε να δέχεται ως γλωσσολογικές μεταβλητές τα «κρύο», «ζέστη», «καύσωνας» κλπ. Κάθε γλωσσολογική μεταβλητή μπορεί να είναι ασαφής και να έχει δικούς της βαθμούς συμμετοχής στο σύνολο, όπως φαίνεται στο επόμενο σχήμα:
Σχήμα 5.6 Παράδειγμα βαθμών συμμετοχής γλωσσικών μεταβλητών
Όπου:
Δεδομένων δυο συνόλων Α και Β, η συνάρτηση συμμετοχής μιας ένωσης συνόλων είναι:
Για παράδειγμα, η τιμή 10 που παρατηρήθηκε ως θερμοκρασία συμμετέχει στην ένωση των ασαφών γλωσσολογικών μεταβλητών ‘ζέστη’ και ‘κρύο’ ως εξής:
Η συνάρτηση συμμετοχής μιας ένωσης ασαφών εννοιών υπολογίζεται ως ακολούθως:
Για παράδειγμα:
Ως συνάρτηση συμμετοχής συνήθως χρησιμοποιείται μια σιγμοειδής (sigmoid), τριγωνική (triangular) ή τραπεζοειδής ή (trapezoid) συνάρτηση.
5.7.1 Ασαφείς κανόνες
Όπως προαναφέραμε, ένας ασαφής κανόνας) συσχετίζει ασαφείς έννοιες σε μια μορφή υποθετικών προτάσεων:
ΕAΝ ο καιρός είναι κρύος και ντυθείς ελαφρά
ΤΟΤΕ θα αρρωστήσεις πολύ
ΑΝ αρρωστήσεις πολύ
ΤΟΤΕ δε θα γράψεις καλά στις εξετάσεις
Η αναλυτική περιγραφή ενός ασαφούς κανόνα είναι μία ασαφής σχέση R(x,y) που ονομάζεται σχέση συνεπαγωγής (implication relation).
Υποθέστε τώρα ότι έχουμε τους ακόλουθους κανόνες:
Κανόνας1: Εάν Ε11 και Ε12
Τότε Η1
Κανόνας2: Εάν Ε21 και Ε22
Τότε Η2
Κανόναςn:…..
Για τον προσδιορισμό της τιμής αληθείας (truth value) που αφορά όλους τους κανόνες που εκτελούνται σε ένα σύστημα. μπορούμε να χρησιμοποιήσουμε την max-min μέθοδο, όπου η τελική τιμή αλήθειας δίνεται από τη συνάρτηση:
Εκτός της max-min συνάρτησης, υπάρχουν και άλλες λιγότερο ή περισσότερο πολύπλοκες.
Παράδειγμα εφαρμογής Ασαφούς λογικής
Χρησιμοποιήστε τη μέθοδο max-min που παρουσιάστηκε ακριβώς από πάνω, για να βρείτε την τιμή αλήθειας στο επόμενο σύστημα κανόνων, που αφορά την κίνηση μιας βαλβίδας σε σχέση με τη θερμοκρασία και την πίεση σε ένα μηχάνημα:
- Κανόνας1:
- Εάν η θερμοκρασία είναι κρύα
- και η πίεση είναι αδύνατη
- Τότε η κίνηση της βαλβίδας είναι θετικά υψηλή (PL)
- Κανόνας2:
- Εάν η θερμοκρασία είναι κρύα
- και η πίεση είναι χαμηλή
- Τότε η κίνηση της βαλβίδας είναι θετικά μέτρια (PM)
- Κανόνας3:
- Εάν η θερμοκρασία είναι κρύα
- και η πίεση είναι ΟΚ
- Τότε η κίνηση της βαλβίδας είναι μηδενική (ZR)
- Κανόνας4:
- Εάν η θερμοκρασία είναι κρύα
- και η πίεση είναι δυνατή
- Τότε η κίνηση της βαλβίδας είναι αρνητικά μέτρια (NΜ)
Η παρατήρηση των συνθηκών που επικρατούν στο μηχάνημα είναι οι ακόλουθες:
Θερμοκρασία: 90o
Πίεση: 650Pa
Ακολουθεί η διαγραμματική παρουσίαση των συναρτήσεων συμμετοχής των γλωσσολογικών μεταβλητών της θερμοκρασίας και της πίεσης, όπου με κόκκινη διακεκομμένη μεταβλητή σημειώνονται οι βαθμοί συμμετοχής της παρατηρούμενης θερμοκρασίας και πίεσης.
Σχήμα 5.7 Βαθμός συμμετοχής της τιμής 90⁰ για τη θερμοκρασία
Σχήμα 5.8 Βαθμός συμμετοχής της τιμής 650Pa για την πίεση
Βάσει των δεδομένων, οι κανόνες που εκτελούνται είναι ο 2 και ο 3.
Κανόνας2:
Κανόνας3:
Επομένως, η τιμή αληθείας και για τους δυο κανόνες υπολογίζεται με τη μέθοδο max -min ως εξής:
Η συνάθροιση των επιμέρους αποτελεσμάτων οδηγεί στην τιμή αληθείας 0.48 για την κίνηση της βαλβίδας που αποτυπώνεται γραφικά στο επόμενο σχήμα.
Σχήμα 5.9 Βαθμός συμμετοχής την κίνηση της βαλβίδας
Επομένως, η προτεινόμενη τελικώς κίνηση της βαλβίδας είναι αυτή που υποδεικνύει ο κανόνας 2 που παρέχει τη μεγαλύτερη τιμή αλήθειας, δηλαδή ότι η κίνηση της βαλβίδας πρέπει να είναι θετικά μέτρια (PM).
Οι παραπάνω υπολογισμοί παρουσιάστηκαν αρκετά στοιχειωδώς. Η εξαγωγή συμπερασμάτων με ασαφή λογική είναι αρκετά πιο πολύπλοκη, γίνεται σε 4 στάδια (βλέπε Σχήμα 5.10) και ολοκληρώνεται με την αποσαφήνιση των αποτελεσμάτων που προκύπτουν κατά τα 3 πρώτα στάδια:
- Στάδιο 1: Υπολογισμός του βαθμού συμμετοχής (σχέση συνεπαγωγής) στο ασαφές σύνολο κάθε εμπλεκόμενου ασαφούς δεδομένου .
- Στάδιο 2: Παραγωγή επιμέρους αποτελεσμάτων κανόνων μέσω κάποιας συλλογιστικής διαδικασίας.
- Στάδιο 3: Συνάθροιση των επιμέρους αποτελεσμάτων.
- Στάδιο 4: Αποσαφήνιση αποτελεσμάτων.
Σχήμα 5.10 Τα 4 στάδια εξαγωγής συμπερασμάτων με ασαφή λογική
5.8 Προτερήματα και Μειονεκτήματα Εμπείρων Συστημάτων Βασισμένων σε Κανόνες
Ως πλεονεκτήματα των ΕΣ έναντι άλλων τύπων συστημάτων επίλυσης προβλημάτων μπορούν να θεωρηθούν τα παρακάτω:
- Παρέχουν φυσική αναπαράσταση γνώσης. Ένας ειδικός πεδίου εξηγεί συνήθως τη διαδικασία επίλυσης ενός προβλήματος με εκφράσεις όπως αυτή: «Κάτω από τέτοιες-και-τέτοιες συνθήκες, το κάνω-και-έτσι». Τέτοιου τύπου εκφράσεις μπορούν εύκολα να διατυπωθούν αρκετά φυσικά με τη βοήθεια κανόνων παραγωγής.
- Διαθέτουν ομοιόμορφη δομή. Όλοι οι κανόνες παραγωγής έχουν την ίδια δομή ΑΝ –ΤΟΤΕ. Κάθε κανόνας είναι ανεξάρτητο κομμάτι της γνώσης. Η ίδια η σύνταξη των κανόνων παραγωγής τούς επιτρέπει να είναι αυτο-τεκμηριωμένοι.
- Διαχωρίζουν την αναπαράσταση της γνώσης από την επεξεργασία της. Η δομή ενός ΕΣ Βασισμένου σε Κανόνες παρέχει αποτελεσματικό διαχωρισμό της βάσης των γνώσεων από τη Συμπερασματική Μηχανή. Έτσι, καθίσταται δυνατή η ανάπτυξη διαφορετικών εφαρμογών με χρήση του ίδιου κελύφους ΕΣ.
- Είναι δυνατή η ενασχόληση με ελλιπή και αβέβαιη γνώση. Τα περισσότερα ΕΣ Βασισμένα σε Κανόνες είναι σε θέση να διαχειρίζονται και ατελή και αβέβαιη γνώση.
Μειονεκτήματα μπορεί να θεωρηθούν τα ακόλουθα:
- Οι σχέσεις μεταξύ κανόνων είναι αδιαφανείς. Παρά το γεγονός ότι οι επιμέρους κανόνες παραγωγής είναι σχετικά απλοί και αυτο-τεκμηριωμένοι, οι λογικές αλληλεπιδράσεις μεταξύ τους, στο μεγάλο σύνολο των κανόνων, μπορεί να είναι αδιαφανείς. Στα ΕΣ Βασισμένα σε Κανόνες είναι δύσκολο να παρατηρήσουμε πώς οι μεμονωμένοι κανόνες εξυπηρετούν τη συνολική στρατηγική.
- Η στρατηγική αναζήτησης είναι αναποτελεσματική. Η Συμπερασματική Μηχανή εφαρμόζει εξαντλητική αναζήτηση μέσω όλων των κανόνων παραγωγής κατά τη διάρκεια κάθε κύκλου. ΕΣ με ένα μεγάλο σύνολο κανόνων (>100 κανόνες) χρειάζονται μεγάλο χρόνο εκτέλεσης και, συνεπώς, μπορεί να είναι ακατάλληλα για εφαρμογές πραγματικού χρόνου.
- Ένα τυπικό ΕΣ έχει αδυναμία να μάθει. Σε γενικές γραμμές, τα ΕΣ Βασισμένα σε Κανόνες δεν έχουν την ικανότητα να μαθαίνουν από την εμπειρία. Σε αντίθεση με έναν εμπειρογνώμονα, ο οποίος ξέρει πότε να «παραβιάσει τους κανόνες», ένα ΕΣ δεν μπορεί να τροποποιήσει αυτόματα τη βάση των γνώσεών του ή να προσαρμόσει τους ισχύοντες κανόνες ή να προσθέσει νέους. Ο μηχανικός γνώσης εξακολουθεί να είναι υπεύθυνος για την αναθεώρηση και διατήρηση του συστήματος.