"युनिकोड" का संशोधनहरू बिचको अन्तर

सा बट: पुनर्निदेश मिलय्‌यानाच्वँगु
सा नेपाली सङ्ख्या कायम गर्दै
पङ्क्ति ४१:
 
=== हानियाँ ===
यूनिकोड, [[आस्की]] तथा अन्य [[अक्षर कोडन|कैरेकटर कोडों]] को अपेक्षा अधिक स्मृति (मेमोरी) लिन्छ। कितनी अधिक स्मृति लगेगी यो यस कुरा मा निर्भर गर्दछ कि तपाईं को सा यूनिकोड प्रयोगएर रहे छन्। UTF7UTF७, UTF8UTF८, UTF16UTF१६ या वास्तविक यूनिकोड - एक अक्षर अलग-अलग बाइट प्रयोग गर्छन।
 
== देवनागरी यूनिकोड ==
* देवनागरी यूनिकोड को परास (रेंज) 0900०९०० देखि 097F०९७F सम्म छ। (दोनो संख्याहरू षोडषाधारी हैं)
 
* क्ष, त्र एवं ज्ञ को लागि अलग देखि कोड छैन। यिनलाई संयुक्त वर्ण मानएर अन्य संयुक्त वर्णहरु को भांति यिनीहरुका अलग देखि कोड हैन दिइएको छ।
पङ्क्ति ८६:
[[यूनिकोड कन्सर्शियम]], एक लाभ न कमाने वाला एक संगठन हो जसको स्थापना [[यूनिकोड स्टैंडर्ड]], जो आधुनिक सफ्टवेयर उत्पादनहरु र मानकहरु मा पाठ को प्रस्तुति को निर्दिष्ट गर्दछ, को विकास, विस्तार र यसको प्रयोग लाई बढावा दिन को लागि गरिएको थियो। यस कन्सर्शियम को सदस्यहरु मा, कम्प्युटर र सूचना उद्योग मा विभिन्न निगम र संगठन शामिल छन्। यस कन्सर्शियम को वित्तपोषण पूर्णतः सदस्यहरु को शुल्क देखि गरिन्छ। यूनिकोड कन्सर्शियम मा सदस्यता, विश्व मा कहीं पनि स्थित उन संगठनहरु र व्यक्तिहरु को लागि खुली छ जो यूनिकोड को समर्थन गर्छन र जो यसको विस्तार र कार्यान्वयन मा सहायता गर्न चाहते छन्।
 
== UTF-8, UTF-16१६ तथा UTF-32३२ ==
# यूनिकोड को मतलब छ सबै लिपिचिह्नों को आवश्यकता को पूर्ति गर्न मा सक्षम 'एकसमान मानकीकृत कोड' ।
# पहिले सोचा गएको थियो कि केवल १६ बिट को माध्यम ले नै दुनिया को सबै लिपिचिह्नहरुको लागि अलग-अलग कोड प्रदान किये जा सकेंगे। त्यस पछि थाहा भएको कि यो कम छ। फेरि यसलाई ३२ बिट गरइयो। अर्थात यस समय दुनिया को कुनै संकेत छैन जसलाई ३२ बिट को कोड मा कहीं न कहीं ठाँउ न मिल गयी हो।
# ८ बिट को कुल २पर घात ८ = २५६ अलग-अलग बाइनरी संख्याहरु बन सकती हैं; १६ बिट देखि २ मा घात १६ = ६५५३६ र ३२ बिट देखि ४२९४९६७२९६ भिन्न (distinct) बाइनरी संख्याहरु बन सकती छन्।
# यूनिकोड को तीन रूप प्रचलित छन्। UTF-8, UTF-16१६ र UTF-32३२.
# यिनीहरुमा अन्तर के हो? मान लीजिये तपाईंको नजिकै दस पेज को कुनै टेक्स्ट छ जसमा रोमन, देवनागरी, अरबी, गणित को चिन्ह आदि धेरै केहि छ। यिनी चिन्हों को यूनिकोड अलग-अलग होंगे। यहाँ ध्यान दिन योग्य कुरा हो कि केहि संकेतहरु को ३२ बिट को यूनिकोड मा शुरू मा शून्य नै शुन्य हो (जस्तै अंग्रेजी को संकेतहरु को लागि)। यदि शुरुआती शून्यहरुलाई हटा दिए जाय त यिनलाई केवल ८ बिट को द्वारा पनि निरूपित गरिन सक्छ र कहीं कुनै भ्रम या कांफ्लिक्ट हुनेछैन। त्यहि तरिका रूसी, अरबी, हिब्रू आदि को यूनिकोड यस्तो हो कि शून्य को छोड दिए पछि उनलाई प्राय: १६ बिट = २ बाइट देखि निरूपित गरिन सक्छ। देवनागरी, जापानी, चीनी आदि को आरम्भिक शून्य हटाउन पछि प्राय: २४ बिट = तीन बाइट देखि निरूपित गरिन सक्छ। किन्तु धेरै देखि संकेत हुनेछन् जसमा आरम्भिक शून्य हुनेछैनन् र उनलाई निरूपित गर्न को लागि चार बाइट नै लगेंगे।
# बुन्दु (५) मा बताए गये काम को UTF-8, UTF-16१६ र UTF-32३२ थोडा अलग अलग ढंग देखि गर्छन। उदाहरण को लागि यूटीएफ-८ के गर्दछ कि केहि लिपिचिह्नहरुको लागि १ बाइट , केहि को लागि २ बाइट, केहि को लागि तीन बढी चार बाइट प्रयोग गर्दछ। तर UTF-16१६ त्यहि काम को लागि १६ न्यूनतम बिटहरुको प्रयोग गर्दछ। अर्थात जो चीजहरु UTF-8 मा केवल एक बाइट ठाँउ लेती थिए उनि अब १६ बिट==२ बाइट को द्वारा निरूपित होंगी। जो UTF-8 मा २ बाइट लेतीं थियो यूटीएफ-१६ मा पनि दुइ नै लेंगी। किन्तु पहिले जो संकेतदि ३ बाइट या चार बाइट मा निरूपित हुन्थे यूटीएफ-१६ मा ३२ बिट=४ बाइट को द्वारा निरूपित गरिनेछ। (तपाईंको नजिकै ठुला-बडी ईटाहरु हो र उनको बिना तोडे खम्भा बनाउन हो त खम्भा ज्यादा बडा नै बनाया जान सक्छ। )
# लगभग स्पष्ट छ कि प्राय: UTF-8 मा इनकोडिंग गर्न देखि UTF-16१६ को अपेक्षा कम बिट्स लगेंगे।
# यसको वाहेक धेरै देखि पुराना सिस्टम १६ बिट को हैंडिल गर्न मा अक्षम थिए। उनि एकबार मा केवल ८-बिट नै संग काम गरेर सकते थिए। यस कारण पनि UTF-8 को अधिक अपनाएइयो। यो अधिक प्रयोग मा आउछ।
# UTF-16१६ र UTF-32३२ को पक्ष मा राम्रोई यो हो कि अब कम्प्युटरहरु को हार्डवेयर ३२ बिट या ६४ बिट को भएको छ। यस कारण UTF-8 को फाइलहरुलाई 'प्रोसेस' गर्न मा UTF-16१६, UTF-32३२ वाला फाइलों को अपेक्षा अधिक समय लगेगा।
 
== उपयोगी यूनिकोड औजार (टूल्स) ==
पङ्क्ति १०३:
:* (ग) Numeric Value Generator
* [http://people.w3.org/rishida/scripts/uniview/descn UniView] - An XHTML-based application to look up characters, character blocks, paste in and discover unknown characters, store your own info about characters, search on character names, do hex/dec/ncr conversions, highlight character types, etc. etc.
* [http://www.macchiato.com/unicode/convert.html UTF-8, UTF-16१६, UTF-32३२ Code Charts and Converter]
* [http://www-atm.physics.ox.ac.uk/user/iwi/charmap.html Character map] (requires [[JavaScript]])
 
पङ्क्ति १३०:
* [http://www.unicode.org/onlinedat/products.html यूनिकोड-सक्षम उत्पादनहरु को सूची] - आपरेटिंग सिस्टम, ब्राउजर, प्रोग्रामिंग को भाषाहरु, एवं अन्य अनेक उत्पाद
* [http://www.unicode.org/faq/indic.html#3 FAQ about Unicode for Indic Scripts and Languages]
* [http://www.utf8-chartable.de/unicode-utf8-table.pl UTF-8 encoding table and Unicode characters]
* [http://www.decodeunicode.org/ DecodeUnicode - यूनिकोड विकी], 50५०.000००० gifs
* [http://tlt.its.psu.edu/suggestions/international/bylanguage/devanagarichart.html Unicode Entity Codes for the Devanāgarī Script]
* [http://unicode.org/charts/PDF/U0900.pdf देवनागरी को यूनिकोड चार्ट] (स्टैण्डर्ड 5.0)
* [http://unicode.coeurlumiere.com/ Table of Unicode characters from 1 to 65535६५५३५]
* [http://www.decodeunicode.org/ decodeunicode.org] images of all 98९८,884८८४ graphical unicode characters (German/English, full text search)
* Tim Bray's [http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF Characters vs Bytes] explains how the different encodings work.
* [http://www.linguistlist.org/~hdry/Zadar/Unicode.pdf '''Unicode'''] (good introduction)
पङ्क्ति १४२:
 
=== यूनिकोड उपकरण तथा फण्ट ===
* [http://rishida.net/tools/conversion/ Unicode Code Converter v7v७.03०३] - यूनिकोड को तरह-तरह को वैकल्पिक रूपहरु मा बदलन वाला आनलाइन प्रोग्राम
* [http://www.freebyte.com/programming/unicode/#freecppunicodelibraries Free C++ Unicode Libraries]
* [http://www.alanwood.net/unicode/ Alan Wood's Unicode Resources] Contains lists of word processors with Unicode capability; fonts and characters are grouped by type; characters are presented in lists, not grids.
"https://ne.wikipedia.org/wiki/युनिकोड" बाट अनुप्रेषित