AUTHOR’S CORNER
Ναι, και εσύ εκπαιδεύεις αλγόριθμους τεχνητής νοημοσύνης!
20.06.2022
από την Γεωργία Παρασκάκη
SHARE
Γνωρίζεις αυτά τα τεστ CAPTCHA που πρέπει να περάσουμε κάθε φορά που θέλουμε να αποκτήσουμε πρόσβαση σε μια ιστοσελίδα; Δεν είναι ύποπτα δύσκολα; Όχι, δεν είναι μόνο δική σου εντύπωση, όντως είναι δύσκολα!
Θυμάσαι την τελευταία φορά που ήθελες να αποκτήσεις πρόσβαση σε μια ιστοσελίδα και σου ζητήθηκε να επιλέξεις τις εικόνες όπου απεικονίζεται ένα ποδήλατο ή να αναγνωρίσεις κάποια γράμματα σε ένα κάπως παραμορφωμένο κείμενο; Οι εικόνες πιθανόν ήταν θολές και το κείμενο ήταν σίγουρα δύσκολο να αποκρυπτογραφηθεί! Ίσως σού δώσανε 5 γράμματα ή αριθμούς και μόνο 2 από αυτά ήταν εύκολο να αναγνωριστούν. Για τα υπόλοιπα, το πιθανότερο είναι ότι μάλλον χρειάστηκε να μαντέψεις. Δεν είναι ότι δεν είσαι καλή ή καλός σε αυτό, η αλήθεια είναι ότι αυτή η αποκρυπτογράφηση είναι όντως δύσκολη.
Το CAPTCHA (Completely Automated Public Turing Test To Tell Computers and Humans Apart) τεστ προσπαθούν να αναγνωρίσουν αν ο επισκέπτης είναι bot ή άνθρωπος και έτσι, να αποτρέψουν απάτες και αυτοματοποιημένες επιθέσεις υπολογιστών. Όμως τότε, γιατί αυτά τα τεστ είναι τόσο δύσκολα; Λοιπόν, η απάντηση είναι πολύπλοκη. Ενώ όντως σε ένα βαθμό πρέπει να μπορείς να αναγνωρίσεις κάποια από τα γράμματα, την ίδια στιγμή…προετοιμάζεις δεδομένα για αλγόριθμους τεχνητής νοημοσύνης!
Τι σημαίνει όμως αυτό; Σκέψου ότι αυτό το παραμορφωμένο κείμενο ήταν κάποτε μέρος ενός βιβλίου το οποίο έχει εν μέρει καταστραφεί και κανένας άνθρωπος δεν μπορεί να το διαβάσει εύκολα και να καταλάβει το περιεχόμενό του. Σε αυτή την περίπτωση, η τεχνητή νοημοσύνη μπορεί να δώσει απαντήσεις και να αποκρυπτογραφήσει το κείμενο. Όμως, ένας άνθρωπος μόνος του δεν μπορεί να εκπαιδεύσει τον αλγόριθμο. Και που βρίσκουμε άρα τους εκπαιδευτές για αυτή τη δουλειά; Μάντεψε: όταν εικάζεις από ποια γράμματα αποτελείται το κείμενο στα CAPTCHA, στην πραγματικότητα παράγεις δεδομένα για να εκπαιδευτεί ο αλγόριθμος τεχνητής νοημοσύνης μέχρι...να λυθεί το μυστήριο του κειμένου! Αυτή η τακτική είναι ευνοϊκή για όλους τους εμπλεκόμενους: είτε αυτά τα προβλήματα τεχνητής νοημοσύνης λύνονται όταν μαζευτούν αρκετά δεδομένα, είτε παραμένουν άλυτα και μπορούν να χρησιμοποιηθούν ως μια μέθοδος να διαχωρίσουμε τους ανθρώπους από τους υπολογιστές.
Η τεχνητή νοημοσύνη χρειάζεται δεδομένα, πολλά δεδομένα. Πολλοί αλγόριθμοι υπάρχουν, αλλά αν δεν έχεις αρκετά δεδομένα, δε γίνεται να τους εκπαιδεύσεις σωστά. Φανταστείτε ένα μωρό που βλέπει για πρώτη φορά σκύλους και γάτες. Αρχικά, δείχνεις στο μωρό τη φωτογραφία ενός σκύλου Ντόμπερμαν και του λες ότι αυτό το ζώο λέγεται σκύλος. Την επόμενη μέρα, δείχνεις μια γάτα Περσίας, αυτή τη φορά ενημερώνεις το μωρό ότι αυτή είναι μια γάτα. Την επόμενη μέρα, όμως, φέρνεις ένα σκύλο Παπιγιόν. Θα μπορέσει το μωρό να καταλάβει ότι πρόκειται για έναν σκύλο όταν το μέγεθος και το τρίχωμα είναι πιο κοντά στη γάτα Περσίας; Κατά πάσα πιθανότητα όχι. Το μωρό χρειάζεται να δει περισσότερους σκύλους και γάτες (δεδομένα) ώστε να εντοπίσει τα χαρακτηριστικά του κάθε ζώου (π.χ. μύτη, μάτια, ουρά κ.τ.λ.) και να μπορέσει να φτιάξει ένα σωστό μοντέλο και να τα κατηγοριοποιήσει σωστά. Έτσι ακριβώς και η τεχνητή νοημοσύνη χρειάζεται πολλά κατηγοριοποιημένα δεδομένα ώστε να μπορέσει να λύσει πολύπλοκα προβλήματα!
Ας βάλουμε την ιστορία σε μια σειρά τώρα. Οι ιστοσελίδες δέχονται να χρησιμοποιήσουν τα τεστ CAPTCHA γιατί τους προστατεύουν από bots και την ίδια στιγμή, τα δεδομένα που των χρηστών βάσει των απαντήσεων που δίνουν χρησιμοποιούνται για να εκπαιδεύσουν αλγόριθμους τεχνητής νοημοσύνης και να λύσουν περίπλοκα και μακροχρόνια προβλήματα. Η ερώτηση είναι η εξής: θα είχες συμφωνήσει αν ήξερες ότι έτσι λειτουργεί αυτό το σύστημα; Είσαι περήφανος που συμβάλλεις στην εξέλιξη της τεχνητής νοημοσύνης και στην επίλυση σημαντικών άλυτων προβλημάτων ή φοβάσαι επειδή συμμετέχεις τόσο καιρό χωρίς να το ξέρεις; Όπως συνήθως συμβαίνει με την εξέλιξη της τεχνολογίας, δεν υπάρχει μια μοναδική απάντηση και η αλήθεια μάλλον βρίσκεται κάπου στη μέση.
* Λεξικό: bots: ;εφαρμογές λογισμικού που εκτελούν αυτοματοποιημένες εργασίες μέσω του Διαδικτύου, εκπαιδευτές: άτομα που ταξινομούν δεδομένα, Τεχνητή νοημοσύνη: νοημοσύνη που υποδεικνύεται από μηχανές που προσπαθούν να μιμηθούν την ανθρώπινη νοημοσύνη εκτελώντας εργασίες
Πηγές: [1] CAPTCHA: Telling Humans and Computers Apart Automatically, [2] CAPTCHA: Using Hard AI Problems for Security, [3] AI-resistant captchas: Are they really possible?
ΣΧΕΤΙΚΑ ΑΡΘΡΑ
Τι είναι πιο απίθανο από την λειτουργία του εγκεφάλου μας; Οι άνθρωποι που την καταλαβαίνουν!
Μια σύντομη αναφορά στην επιτυχημένη νευροεπιστήμονα Φανή Κουκούλη.
PODCAST 9 – Θεματικός μήνας: mentoring
Τί είναι το πρόγραμμα mentoring που προσφέρουμε ως Greek Women in STEM; Σε ποιες και ποιους απευθύνεται; Πόσο χρόνο παίρνει και τι ερωτήματα μπορεί να θέσει κάποια στις μέντορες; Αυτά και άλλα πολλά συζητάμε στο επεισόδιο Φεβρουαρίου, στα πλαίσια του θεματικού μήνα mentoring που θα τρέχει όλο το Φλεβάρη στις Greek Women in STEM.
Αρχείο
Βρείτε όλα τα άρθρα μας με χρονολογική σειρά στο αρχείο μας.
ΕΠΙΚΟΙΝΩΝΙΑ
____________
greekwomeninstem@gmail.com
'Εχετε ιδέες, ερωτήσεις, σχόλια ή ειδικά αιτήματα;
Θέλετε να γράψουμε για την έρευνά σας ή να προτείνετε κάποια ερευνήτρια για την οποία θα θέλατε να μάθετε περισσότερα;
Στείλτε μας μειλ ή συμπληρώστε την φόρμα και πατήστε "υποβολή" και θα χαρούμε να έρθουμε σε επαφή μαζί σας!
[contact-form-7 id=”44″ title=”Contact form 1″]