"युनिकोड" का संशोधनहरू बिचको अन्तर

सा बोट: स्वचालित पाठ परिवर्तन (-लाइ +लाई)
सा बोट: स्वचालित पाठ परिवर्तन (-अंग्रेजी +अङ्ग्रेजी)
पङ्क्ति १२:
* चाहे कुनै पनि भाषा हो।
 
कम्प्युटर, मूल रूप से, नम्बरबाट सम्बंध राखछन। यो प्रत्येक अक्षर र वर्ण को लागि एक नम्बर निर्धारित गरेर अक्षर र वर्ण संग्रहित गर्छन। यूनिकोड को आविष्कार होने भन्दा पहिले, यस्तो नम्बर दिन को लागि सैंकडों विभिन्न [[संकेत लिपि प्रणाली|संकेत लिपि प्रणालिहरु]] थिए। कुनै एक संकेत लिपि मा पर्याप्त अक्षर हैन हुन सक्छन् : उदाहरण को लिए, [[यूरोपीय संघ]] को एक्लै ही, आफ्नो सबै भाषाहरु को कवर गर्न को लागि अनेक विभिन्न संकेत लिपिहरु को आवश्यकता हुन्छ। अंग्रेजीअङ्ग्रेजी जस्तो भाषा को लागि पनि, सबै अक्षरहरु, विरामचिन्हों र सामान्य प्रयोग को प्रौद्योगिकी प्रतीकहरु हेतु एक नै संकेत लिपि पर्याप्त थिएन।
 
यो संकेत लिपि प्रणालिहरु मास्पर विरोधी पनि छन्। यसैको लागि, दुइ संकेत लिपिहरु दुइ विभिन्न अक्षरहरु को लिए, एक नै नम्बर प्रयोग गर्न सक्छं, अथवा समान अक्षर को लागि विभिन्न नम्बरहरुको प्रयोग गर्न सक्छं। कुनै पनि कम्प्युटर (विशेष रूप ले सर्वर) को विभिन्न संकेत लिपिहरु संभालनी पडती है; फेरि पनि जब दुइ विभिन्न संकेत लिपिहरु अथवा [[प्लेटफर्म (कम्प्यूटर)|प्लेटफर्मों]] को बीच [[डाटा]] पठाइन्छ त उन डाटा को संधै खराब भएको जोखिम रहन्छ।
पङ्क्ति ९१:
# ८ बिट को कुल २पर घात ८ = २५६ अलग-अलग बाइनरी संख्याहरु बन सकती हैं; १६ बिट देखि २ मा घात १६ = ६५५३६ र ३२ बिट देखि ४२९४९६७२९६ भिन्न (distinct) बाइनरी संख्याहरु बन सकती छन्।
# यूनिकोड को तीन रूप प्रचलित छन्। UTF-८, UTF-१६ र UTF-३२.
# यिनीहरुमा अन्तर के हो? मान लीजिये तपाईंको नजिकै दस पेज को कुनै टेक्स्ट छ जसमा रोमन, देवनागरी, अरबी, गणित को चिन्ह आदि धेरै केहि छ। यिनी चिन्हों को यूनिकोड अलग-अलग होंगे। यहाँ ध्यान दिन योग्य कुरा हो कि केहि संकेतहरु को ३२ बिट को यूनिकोड मा शुरू मा शून्य नै शुन्य हो (जस्तै अंग्रेजीअङ्ग्रेजी को संकेतहरु को लागि)। यदि शुरुआती शून्यहरुलाई हटा दिए जाय त यिनलाई केवल ८ बिट को द्वारा पनि निरूपित गरिन सक्छ र कहीं कुनै भ्रम या कांफ्लिक्ट हुनेछैन। त्यहि तरिका रूसी, अरबी, हिब्रू आदि को यूनिकोड यस्तो हो कि शून्य को छोड दिए पछि उनलाई प्राय: १६ बिट = २ बाइट देखि निरूपित गरिन सक्छ। देवनागरी, जापानी, चीनी आदि को आरम्भिक शून्य हटाउन पछि प्राय: २४ बिट = तीन बाइट देखि निरूपित गरिन सक्छ। किन्तु धेरै देखि संकेत हुनेछन् जसमा आरम्भिक शून्य हुनेछैनन् र उनलाई निरूपित गर्न को लागि चार बाइट नै लगेंगे।
# बुन्दु (५) मा बताए गये काम को UTF-८, UTF-१६ र UTF-३२ थोडा अलग अलग ढंग देखि गर्छन। उदाहरण को लागि यूटीएफ-८ के गर्दछ कि केहि लिपिचिह्नहरुको लागि १ बाइट , केहि को लागि २ बाइट, केहि को लागि तीन बढी चार बाइट प्रयोग गर्दछ। तर UTF-१६ त्यहि काम को लागि १६ न्यूनतम बिटहरुको प्रयोग गर्दछ। अर्थात जो चीजहरु UTF-८ मा केवल एक बाइट ठाँउ लेती थिए उनि अब १६ बिट==२ बाइट को द्वारा निरूपित होंगी। जो UTF-८ मा २ बाइट लेतीं थियो यूटीएफ-१६ मा पनि दुइ नै लेंगी। किन्तु पहिले जो संकेतदि ३ बाइट या चार बाइट मा निरूपित हुन्थे यूटीएफ-१६ मा ३२ बिट=४ बाइट को द्वारा निरूपित गरिनेछ। (तपाईंको नजिकै ठुला-बडी ईटाहरु हो र उनको बिना तोडे खम्भा बनाउन हो त खम्भा ज्यादा बडा नै बनाया जान सक्छ। )
# लगभग स्पष्ट छ कि प्राय: UTF-८ मा इनकोडिंग गर्न देखि UTF-१६ को अपेक्षा कम बिट्स लगेंगे।
"https://ne.wikipedia.org/wiki/युनिकोड" बाट अनुप्रेषित