साइमन, लिनक्स स्पीच रिकग्निशन इंजन से मिलें
लिनक्स के लिए साइमन आईओएस के लिए सिरी है। खैर, यह शायद नहीं है, लेकिन दोनों के नाम "एस" से शुरू होने के अलावा, वे दोनों सुनते हैं कि आपको क्या कहना है। अंतर यह है कि साइमन बहुत अधिक नियंत्रित है। इसे वॉइस कमांड को पहचानने के लिए पूरी तरह से प्रशिक्षित किया जा सकता है, जो विकलांग लोगों के लिए उपयोगी सहायता हो सकती है या यहां तक कि जो लोग अपनी आवाजों के साथ अपने सिस्टम को नियंत्रित करना पसंद करते हैं।
साइमन है:
- एक ओपन-सोर्स भाषण मान्यता कार्यक्रम और माउस और कीबोर्ड को प्रतिस्थापित करता है।
- बहुत लचीला होने के लिए डिज़ाइन किया गया है और किसी भी एप्लिकेशन के लिए अनुकूलन की अनुमति देता है जहां भाषण मान्यता की आवश्यकता होती है।
- भाषा-स्वतंत्र प्रोग्रामिंग की वजह से "ई-समावेश" की एक संभावित यूरोपीय परियोजना।
- शारीरिक रूप से अक्षम लोगों और वरिष्ठ नागरिकों के लिए विकास में उन्हें चैट करने, ई-मेल लिखने, इंटरनेट सर्फ करने, इंटरनेट बैंकिंग करने और बहुत कुछ करने की संभावना प्रदान करने के लिए।
(simonlistens.org से)
साइमन प्राप्त करना
साइमन क्यूटी में लिखा गया है और फोनन पर निर्भर करता है, इसलिए इसे शायद केडीई (प्लाज़्मा)-आधारित सिस्टम पर स्थापित करना सबसे अच्छा है, जब तक आपको इंस्टॉलेशन के साथ ~ 300 एमबी निर्भरता को खींचने में कोई फर्क नहीं पड़ता (कुबंटू 15.04 सिस्टम पर, साइमन केवल 55 एमबी लेता है)। साइमन उबंटू रिपोजिटरीज़ में है, इसलिए इसे इंस्टॉल करना उतना आसान होगा जितना आसान होगा
sudo apt-simon इंस्टॉल करें
किसी भी उबंटू-आधारित डिस्ट्रो पर। लिनक्स मिंट (या अन्य डिस्ट्रोज़ में) में, यदि आपको लगता है कि साइमन इंस्टॉलेशन के बाद कनेक्ट नहीं हो सकता है, तो आपको libqt4-sql-lite
इंस्टॉल करना होगा
sudo apt-libqt4-sql-sqlite स्थापित करें
यदि आप एचटीके ध्वनिक मॉडल का उपयोग करना चाहते हैं, तो आपको एचटीके इंस्टॉल करने की भी आवश्यकता है। यह वैकल्पिक है, और यदि आपको नहीं पता कि इसका क्या अर्थ है, या आपको इसका उपयोग करने की आवश्यकता नहीं है, तो आप इसे सुरक्षित रूप से छोड़ सकते हैं। दुर्भाग्यवश एचटीके केवल स्रोत कोड के रूप में उपलब्ध है, लेकिन ये सरल निर्देश इंस्टॉलेशन को सरल बना देंगे।
साइमन सुनता है
साइमन सेट अप या उपयोग करना आसान नहीं है। आपको इसे सुनने में मदद करने के लिए, एक सहायक सेटअप आपको प्रक्रिया के माध्यम से चलने वाले पहले भाग पर आपको धन्यवाद देता है।
सबसे पहले आपको परिदृश्य स्थापित करने की आवश्यकता है।
परिदृश्य पूर्ण पैकेज हैं जो आपको विशिष्ट उद्देश्यों के लिए साइमन का उपयोग करने की अनुमति देंगे। वे कम से कम परिस्थितियों में, सभी मौजूदा शब्दों का वर्णन करते हुए और कौन से वाक्य व्याकरणिक रूप से सही हैं, एक भाषा मॉडल के रूप में जाना जाता है।
डिफ़ॉल्ट रूप से आपके पास केवल एक मानक परिदृश्य स्थापित है। इस स्क्रीन से आप साइमन एडन-इंस्टॉलर ("ओपन -> डाउनलोड") के साथ कुछ भी बना सकते हैं या लोड कर सकते हैं।
इसके बाद आपको एक ध्वनिक या भाषण मॉडल की आवश्यकता होगी। यह मूल रूप से साइमन को बताता है कि व्यक्तिगत शब्द कैसा लगता है।
यदि आपके पास एचटीके स्थापित है, तो आप अपना खुद का मॉडल बना सकते हैं और साइमन को प्रशिक्षित कर सकते हैं ताकि आप जिस विशिष्ट तरीके से बात कर सकें। यदि आपके पास एचटीके नहीं है या इसका उपयोग करने की परवाह नहीं है, तो आप स्थिर आधार मॉडल ("ओपन मॉडल -> डाउनलोड") डाउनलोड कर सकते हैं जो साइमन को पूर्वनिर्धारित ध्वनिक पैटर्न प्रदान करेगा।
यदि आप एक स्थिर मॉडल के साथ जाते हैं, तो आप बाद में प्रशिक्षण नमूने के साथ अनुकूलित करना चुन सकते हैं।
सर्वर सेटिंग्स पृष्ठ पर, यदि आप इसे स्थानीय रूप से स्थापित करने जा रहे हैं और इसे नियमित रूप से उपयोग करने की योजना बना रहे हैं, तो आप डिफ़ॉल्ट विकल्प को छोड़ना सुरक्षित हैं। यदि सर्वर कहीं और स्थित है, तो यह वह जगह है जहां आप इसे परिभाषित कर सकते हैं।
आपको ध्वनि रिकॉर्डिंग और प्लेबैक डिवाइस सेट अप करने की आवश्यकता है,
अपने माइक्रोफोन का परीक्षण करें,
और आप साइमन का उपयोग करने के लिए तैयार हैं।
मुख्य स्क्रीन से, आप अपने लोड किए गए परिदृश्यों को प्रबंधित कर सकते हैं या एक विशिष्ट खोल सकते हैं।
एक परिदृश्य खोलने के बाद, आप शब्दावली और व्याकरण को देख और संशोधित कर सकते हैं, ध्वनिक मॉडल को प्रशिक्षित कर सकते हैं, परिदृश्य की संदर्भ निर्भरता को संशोधित कर सकते हैं और प्रत्यक्ष आदेश सेट कर सकते हैं।
प्रशिक्षण विज़ार्ड को ओवरव्यू स्क्रीन से भी शुरू किया जा सकता है; आपको परिदृश्य सेटिंग में जाने की आवश्यकता नहीं है।
ओवरव्यू स्क्रीन पर आपको ऑडियो (हार्डवेयर) कॉन्फ़िगरेशन बदलने या ध्वनिक (भाषण) मॉडल को कॉन्फ़िगर करने का अवसर भी है, जिसमें नए जोड़े भी शामिल हैं।
साइमन का उपयोग करके और मदद
साइमन का उपयोग सीधा से बहुत दूर है। यह सीखने, प्रशिक्षण, और उपयोग करने के लिए एक अच्छी मात्रा लेता है। सौभाग्य से ऑनलाइन उपलब्ध व्यापक दस्तावेज उपलब्ध है। केडीई उपयोगकर्ताबेस मूल बातें के साथ मदद प्रदान करता है, और साइमन हैंडबुक पीडीएफ फाइल के रूप में उपलब्ध है। साइमन लिस्टेंस ब्लॉग कुछ अंतर्दृष्टि भी प्रदान करता है, हालांकि पोस्ट काफी पुरानी हैं (अंतिम प्रविष्टि 2013 थी)। साइट कुछ और पढ़ने की पेशकश करती है, और आप अपने वाणिज्यिक वेबपृष्ठ पर साइमन द्वारा संचालित वॉयस-नियंत्रित व्यावसायिक समाधानों के बारे में जान सकते हैं।
यद्यपि इसे स्थापित करने और मास्टर करने में कुछ समय लग सकता है, साइमन किसी भी लिनक्स (और यहां तक कि विंडोज) कंप्यूटर को ध्वनि-नियंत्रित वातावरण में बदल सकता है, चाहे वह विशेष आवश्यकताएं हों या केवल उस सुविधा के लिए जिसका उपयोग आप करना चाहते हैं।