Home
Education
Classroom
Knowledge
Blog
TV
ธรรมะ
กิจกรรม
โครงการทรูปลูกปัญญา

รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์

Posted By Plookpedia | 08 มี.ค. 60
6,128 Views

  Favorite

รหัสตัวอักษรไทยที่ใช้ในระบบคอมพิวเตอร์


ความสำคัญของรหัสที่จะใช้ในระบบคอมพิวเตอร์นั้น มิได้ใช้สำหรับแทนตัวข้อมูลที่จะให้คอมพิวเตอร์ประมวลผล แต่เพียงอย่างเดียวเท่านั้น แต่ยังใช้แทนคำสั่ง ที่จะสั่งให้คอมพิวเตอร์ทำงาน หรือควบคุมระบบการทำงานต่างๆ รวมทั้ง ใช้ในการประมวลผลข้อมูลให้เกิดขึ้นตามความต้องการ 

คอมพิวเตอร์เป็นเทคโนโลยี ที่ได้รับการพัฒนามาจากประเทศทางตะวันตก ซึ่งใช้อักษรละติน ดังนั้น จึงมีผู้กำหนดรูปแบบของตัวอักษรละตินเป็นรหัสที่จะให้คอมพิวเตอร์รับรู้ได้ รหัสที่กำหนดนี้จะต้องเหมาะสมกับการทำงานของ คอมพิวเตอร์ที่ใช้หลักการของเลขฐานสอง ดังนั้น จึง กำหนดรหัสแทนตัวอักษรละตินเหล่านั้นเป็นรหัสเลขฐานสอง ซึ่งมีหลักตัวเลขที่เล็กที่สุด คือ บิต เมื่อนำตัวเลขฐานสอง หลายหลักหรือหลายบิตมาประกอบกันเป็นกลุ่มตั้งแต่ ๖, ๗ หรือ ๘ บิต เรียกว่า ไบต์ 

รหัสแทนอักษรภาษาละตินที่นิยมใช้กันจริงๆ จนเป็นมาตรฐานใช้กันทั่วโลกมีเพียง ๒ รหัส คือ รหัสแอสกี (ASCII; American standard code for information interchange) และรหัสเอ็บซีดิก (EBCDIC; extended binary- code-decimal interchange code)

 

รหัสแอสกีเป็นรหัสที่องค์การระหว่างประเทศว่าด้วย การมาตรฐาน (International Standard Organization; ISO) กำหนดขึ้น และใช้กันในระบบคอมพิวเตอร์ทั่วไป โดยใช้อีกชื่อว่า รหัสไอเอสโอ ๖๔๖-๑๙๘๓ (ISO 646- 1983) รหัสแอสกีหรือรหัสไอเอสโอ ที่มีเพียง ๗ บิต ใน แต่ละประเทศจะใช้แตกต่างกันเล็กน้อย โดยเฉพาะในเรื่อง เครื่องหมายพิเศษบางตัว เช่น อักษรแทนเงินตรา รหัสที่ ไอเอสโอกำหนดนี้มีเพียง ๗ บิต จึงแทนรหัสของตัวอักษร ได้ ๒๗ หรือ = ๑๒๘ ตัว โดยกำหนดให้รหัส ๓๒ ตัวแรก คือ ๐๐๐๐๐๐๐ ถึง ๐๐๑๑๑๑๑ เป็นรหัสควบคุม เช่น ส่ง เสียงปิ๊บ ปัดแคร่ (CR; carriage return) ขึ้นบรรทัดใหม่ (LF; line feed) จบเอกสาร (EOT; end of text) เป็นต้น 

ส่วนรหัสเอ็บซีดิก เป็นรหัสที่มีประวัติความเป็นมาค่อนข้างยาวนาน และมีรากฐานมาจากการใช้บัตรเจาะรูแบบฮอลเลอริท โดยมีช่องเจาะอยู่ ๑๒ แถว จัดเป็นแถว ๐ ถึง ๙, ๑๑ และ ๑๒ รหัสบนบัตรเจาะรูส่วนที่เป็นแถว ๐ ถึง ๙ จะแปลเป็นเลขฐานสองโดยตรง ซึ่งเรียกรหัสนี้ว่า บีซีดี (BCD; binary code decimal) ส่วนแถวที่ ๑๑ และ ๑๒ จะได้รับการแปลเป็นเลขฐานสองควบคู่กันไปด้วยแถวละ ๑ หลัก ผลที่ได้คือ จะได้รหัสที่ประกอบด้วยตัวเลขฐานสอง ๖ บิต หลังจากนั้นก็ได้มีการปรับปรุงขึ้น จนในที่สุดรหัสเอ็บซีดิกได้รับการขยายให้ครบ ๘ บิต โดยให้มีตัวอักษรตัวเล็กและตัวใหญ่ อยู่รวมกัน

เพื่อให้การแสดงรหัสของคอมพิวเตอร์เป็นที่เข้าใจได้ ง่าย การแสดงด้วยการแทนรหัสกับตัวอักษรโดยตรง จึงไม่เป็นที่นิยมกันนัก เพราะอ่านลำบาก เปลืองเนื้อที่ และ จดจำได้ยาก การแสดงรหัสจึงแสดงในรูปของตาราง ซึ่งถ้า เป็นรหัส ๘ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๑๖ และ ถ้าเป็นรหัส ๗ บิต จะแสดงในรูปตารางขนาด ๑๖ x ๘ โดย หมายเลขบรรทัด ๐-๑๕ ใช้แทนรหัสเลขท้าย ๔ บิต (เลข ๔ บิต ได้แก่ ๐๐๐๐ ถึง ๑๑๑๑ มี ๑๖ จำนวน เลขบรรทัดจะ ใช้เลขฐาน ๑๖ เป็นตัวบอกคือ ๐, ๑, ๒, ๓, ๔, ๕, ๖, ๗, ๘, ๙, A, B, C, D, E และ F) ส่วนหมายเลขสดมภ์ ๐-๗ หรือ ๐-๑๕ ใช้แทนรหัสเลขต้น ๓ บิต หรือ ๔ บิต (เอ็บซีดิก) กำกับด้วยเลขฐาน ๑๖ เช่นกัน

 

รหัสเอบซีดิก แสดงในรูปตารางขนาด ๑๖ x ๑๖

 

เนื่องจากรหัสแอสกีมีเพียง ๗ บิต (แทนตัวอักษรได้ ๑๒๘ ตัว) เมื่อนำมาใช้แสดงตัวอักษรไทยและอังกฤษ จึงมี ความจำเป็นที่จะต้องขยายเพิ่มอีก ๑ บิต เพื่อให้ได้เป็น ตารางขนาด ๑๖ x ๑๖ และแสดงความหมาย โดยถ้าใน บิตแรกเป็น ๐ ก็จะคงรหัสแอสกีเดิม และถ้าเป็น ๑ ก็แสดง เป็นรหัสไทย แต่สำหรับรหัสเอ็บซีดิกมีรูปแบบอักษรได้ ๒๕๖ ตัว จึงสามารถใส่อักษรไทยลงในช่องว่างได้พอ

สำนักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมกระทรวงอุตสาหกรรม ได้ดำเนินการกำหนดรหัสมาตรฐานภาษาไทย เพื่อใช้กับงานคอมพิวเตอร์ โดยมีขอบข่ายของการใช้รหัสดังนี้ 

๑. มาตรฐานนี้ กำหนดรหัสภาษาไทย เพื่อใช้กับคอมพิวเตอร์ และแลกเปลี่ยนข้อมูล 
๒. มาตรฐานนี้ ครอบคลุมรหัสภาษาไทย ซึ่งแบ่งออกเป็นสองกลุ่ม คือ กลุ่มไอเอสโอ ๖๔๖-๑๙๘๓ และกลุ่มเอ็บซีดิก 
๓. มาตรฐานนี้ กำหนดเฉพาะตัวอักษรภาษาไทย โดยยึดหลักการไม่เปลี่ยนแปลงรหัส ที่องค์การระหว่างประเทศ ว่าด้วยการมาตรฐาน ได้กำหนดไว้แล้ว ตามไอเอสโอ ๖๔๖-๑๙๘๓ และเอ็บซีดิก 

การกำหนดรหัสในตารางเพิ่มต่อไอเอสโอ ๖๔๖-๑๙๘๓ จะดูจากตารางที่มีขนาด ๑๖ x ๑๖ ได้ โดยตำแหน่งของอักษรภาษาไทยเริ่มจากตำแหน่ง A1 (สดมภ์ A แถว ๑)

 

ตารางแสดงรหัสภาษาไทยบนตารางรหัสแอสกี

 

การพัฒนาคอมพิวเตอร์ให้สามารถทำงาน และรับส่งข้อมูลตัวอักษรไทยได้นั้น จำเป็นต้องมีการกำหนดรหัสที่ใช้แทนอักษรไทย ซึ่งได้แก่ ตัวอักษรไทย ตัวเลขไทย และเครื่องหมายพิเศษที่ใช้สื่อความหมายภาษาไทย จำแนกเป็นกลุ่มได้ดังนี้ 

ตัวอักษรไทย ได้แก่

  • พยัญชนะ ได้แก่ ก ข ฃ ค ค ฆ ง จ ฉ ช ซ .....ร ฤ ล (. ..) ว ศ ษ ส ห ฬ อ ฮ

  • สระ ได้แก่ ะ  า  ํา  ุ  ู เ แ โ ใ ไ ํ(นิคหิต) . (พิณทุ)

  • วรรณยุกต์ ได้แก่ ์ (ทัณฑฆาต)

  • ตัวเลขไทย ได้แก่ ๐ ๑ ๒ ๓ ๔ ๕ ๖ ๗ ๘ ๙

  • เครื่องหมายพิเศษ ได้แก่  ๅ ๆ ฯ

  • เครื่องหมายพิเศษทั่วไปได้แก่ ฿ (เครื่องหมายเงินบาท)  e (ยามักการ)  ๏ ฟองมัน  ๛ (โคมูตร) และ ๚ (อังคั่นคู่) เป็นต้น

รหัสภาษาไทยในตารางเอ็บซีดิกนี้ ใช้วิธีการกำหนด ให้ไม่ซ้ำกับอักษรตัวใดตัวหนึ่งที่มีอยู่แล้วในตารางเอ็บซีดิก โดยเริ่มต้นตั้งแต่ตำแหน่ง ๔๑

เว็บไซต์ทรูปลูกปัญญาดอทคอมเป็นเพียงผู้ให้บริการพื้นที่เผยแพร่ความรู้เพื่อประโยชน์ของสังคม ข้อความและรูปภาพที่ปรากฏในบทความเป็นการเผยแพร่โดยผู้ใช้งาน หากพบเห็นข้อความและรูปภาพที่ไม่เหมาะสมหรือละเมิดลิขสิทธิ์ กรุณาแจ้งผู้ดูแลระบบเพื่อดำเนินการต่อไป
Tags
  • Posted By
  • Plookpedia
  • 15 Followers
  • Follow