Πιάστε την τηλεόραση σας για να σας καταλάβει καλύτερα

Odds and Evens - Bud Spencer & Terence Hill - Full Movie by Film&Clips multi subs (Απρίλιος 2019).

Anonim

Νέα έρευνα από το Πανεπιστήμιο του Waterloo έχει βρει έναν τρόπο βελτίωσης των φωνητικών ικανοτήτων κατανόησης των πλατφορμών οικιακής ψυχαγωγίας.

Η έρευνα, σε συνεργασία με το Πανεπιστήμιο του Maryland και το Comcast Applied AI Research Lab, χρησιμοποιεί τεχνολογία τεχνητής νοημοσύνης (AI) για να επιτύχει τις πιο φυσικές ομιλούμενες αλληλεπιδράσεις με τις τηλεοράσεις μέχρι σήμερα.

"Σήμερα, έχουμε συνηθίσει να μιλάμε σε ευφυείς πράκτορες που κάνουν την προσφορά μας - από το Siri σε ένα κινητό τηλέφωνο στην Alexa στο σπίτι. Γιατί δεν πρέπει να είμαστε σε θέση να κάνουμε το ίδιο με τις τηλεοράσεις;" ρώτησε ο Jimmy Lin, καθηγητής στο Πανεπιστήμιο του Waterloo και ο πρόεδρος David R. Cheriton στη Σχολή Επιστημών Υπολογιστών του David R. Cheriton.

"Η Xfinity X1 της Comcast έχει ως στόχο να κάνει ακριβώς αυτό - η πλατφόρμα έρχεται με μια« φωνή απομακρυσμένη »που δέχεται ομιλούμενα ερωτήματα. Η επιθυμία σας είναι η εντολή της - ενημερώστε την τηλεόρασή σας για να αλλάξετε κανάλια, να την ρωτήσετε για ταινίες δωρεάν παιδιών και ακόμη και για τον καιρό πρόβλεψη."

Στην αντιμετώπιση του σύνθετου προβλήματος της κατανόησης των φωνητικών ερωτημάτων, οι ερευνητές είχαν την ιδέα να επωφεληθούν από την τελευταία τεχνολογία AI - μια τεχνική γνωστή ως ιεραρχικά επαναλαμβανόμενα νευρωνικά δίκτυα - για να μοντελοποιήσουν καλύτερα το πλαίσιο και να βελτιώσουν την ακρίβεια του συστήματος.

Τον Ιανουάριο του 2018, το νέο μοντέλο νευρωνικών δικτύων των ερευνητών αναπτύχθηκε στην παραγωγή για να απαντήσει σε ερωτήματα από πραγματικούς χρήστες. Σε αντίθεση με το προηγούμενο σύστημα, το οποίο συγχέεται με περίπου το 8% των ερωτημάτων, το νέο μοντέλο χειρίζεται τα περισσότερα από τα πολύ περίπλοκα ερωτήματα κατάλληλα, βελτιώνοντας σημαντικά την εμπειρία των χρηστών.

"Αν ένας θεατής ζητήσει το" Chicago Fire ", το οποίο αναφέρεται τόσο σε σειρά δράματος όσο και σε ομάδα ποδοσφαίρου, το σύστημα είναι σε θέση να αποκρυπτογραφήσει αυτό που πραγματικά θέλετε", δήλωσε ο Lin. "Αυτό που είναι ιδιαίτερο σε αυτή την προσέγγιση είναι ότι επωφελούμαστε από το πλαίσιο - όπως τα προηγουμένως παρακολουθούμενα shows και τα αγαπημένα κανάλια - για να προσαρμόζουμε τα αποτελέσματα, αυξάνοντας έτσι την ακρίβεια".

Οι ερευνητές έχουν αρχίσει να εργάζονται για την ανάπτυξη ενός ακόμα πιο πλούσιου μοντέλου. Η διαίσθηση είναι ότι με την ανάλυση ερωτημάτων από πολλαπλές προοπτικές, το σύστημα μπορεί να καταλάβει καλύτερα τι λέει ο θεατής.

Το χαρτί, η εκμάθηση πολλαπλών εργασιών με νευρωνικά δίκτυα για την κατανόηση της πλατφόρμας ψυχαγωγίας για φωνητικά ερωτήματα, παρουσιάστηκε στο 24ο Διεθνές Συνέδριο ACM SIGKDD για την ανακάλυψη γνώσης και την εξόρυξη δεδομένων που πραγματοποιήθηκε πρόσφατα στο Ηνωμένο Βασίλειο. Η έρευνα διεξήχθη από τον Jinfeng Rao, Ph.D. απόφοιτος του Πανεπιστημίου του Maryland, του συμβούλου του Lin και του μέντορα Ferhan Ture, ερευνητή στο Comcast Applied AI Research Lab.

menu
menu