สรุป
ฐานข้อมูล และคลังข้อมูล
มีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุด คือ บิต(Bit) ไบต์(Byte) เขตข้อมูล(Field) ระเบียนข้อมูล(Record) และไฟล์(File) ตามลำดับ
บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์ เป็นเลขฐานสอง 0 กับ 1
ไบต์ (Byte) ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน 8 บิต มาเรียงต่อกันเป็น 1 ไบท์ สร้างรหัสแทนข้อมูลใช้แทนอักขระ เป็นตัวเลข ตัวอักษร สัญลักษณ์ ได้ทั้งหมด 28 = 256 ตัว
ขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำให้เกิดความหมาย
ระเบียนข้อมูล (Record) กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน นำมารวมกัน
ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันนำมาจัดเก็บไว้ด้วยกัน
ปัญหาเกี่ยวกับแฟ้มข้อมูล
1. ความซ้ำซ้อนของข้อมูล (Data Redundancy) การเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากต่อการควบคุมความถูกต้องให้ตรงกันของข้อมูล
2. ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) เป็นความผูกพันระหว่างข้อมูลและโปรแกรม โดยการเรียกใช้ข้อมูลต้องมีโปรแกรม หากเปลี่ยนแปลงข้อมูล หรือโครงสร้าง จะมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมที่เกี่ยวข้อง ซึ่งทำให้เกิดค่าใช้จ่ายสูงในการบำรุงรักษาโปรแกรม
3. การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data sharing) มีการจัดเก็บข้อมูลแยกจากกันทำให้ความพร้อมการใช้ข้อมูลยาก ไม่สามารถนำข้อมูลจากหลายแฟ้มมาใช้งานร่วมกันได
4. การขาดความร่วมมือ (Lack of Flexibility) ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองต่อความต้องการใหม่ ๆ
5. การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและใช้ข้อมูล มีขอบเขตความสามารถจำกัด
แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล
- ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy) การนำข้อมูลมารวมกันเพื่อตัดข้อมูลที่ซ้ำกันออกไป ระบบฐานข้อมูลมี DBMS เป็นซอฟต์แวร์ที่ดูแลจัดการข้อมูลทำให้ควบคุมการเกิดความซ้ำซ้อนของข้อมูลได้
- มีความเป็นอิสระต่อกัน (Data Independence) ระบบฐานข้อมูลมีแหล่งรวมข้อมูลเก็บข้อมูลต่างๆ ไว้ส่วนกลาง มี DBMS ดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล
- สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่ต้องเพิ่มข้อมูลเข้าไปในระบบอีก
- มีความคล่องตัวในการใช้งาน (Improved Flexibility) การรวบรวมข้อมูลไว้ที่เดียวกัน มีการควบคุมอยู่ส่วนกลางช่วยให้มีความคล่องตัวในการใช้งานได้มากกว่าระบบไฟล์ข้อมูล DBMS มีเครื่องมือช่วยในการสร้างแบบฟอร์มและรายงานต่าง ๆ ลดขั้นตอน และเวลาในการจัดทำรายงานและการเขียนโปรแกรมได้มาก
- มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัย โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และอนุญาตผู้มีสิทธิเข้ามาในระบบได้เฉพาะสิทธิแต่ละคนเท่านั้น
องค์ประกอบของระบบฐานข้อมูล
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบ 4 ส่วน คือ
- ข้อมูล (Data) คือ ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
- ฮาร์ดแวร์ (Hardware) คือ เครื่องคอมพิวเตอร์ และอุปกรณ์รอบข้าง
- ซอฟต์แวร์ (Software) คือ ระบบปฏิบัติการ และระบบจัดการข้อมูล รวมทั้งโปรแกรมยูทิลิตี้ต่าง ๆ
- ผู้ใช้ (Users) คือ บุคลากรที่เกี่ยวข้องกับระบบฐานข้อมูล ผู้เขียนโปรแกรม และผู้ใช้งาน
รูปแบบของฐานข้อมูล (Database Model)
แบบจำลองฐานข้อมูลอธิบายถึงโครงสร้างและความสัมพันธ์ระหว่างข้อมูล แบบจำลองมีหลายรูปแบบ คือ
- แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model) มีโครงสร้างคล้ายต้นไม้ ข้อมูลมีความสัมพันธ์เรียกว่า One-to-Many หนึ่งต่อกลุ่ม ข้อมูลจัดเก็บในรูปของ Segment ที่อยู่บนสุด เรียกว่า Root Node ถัดลงมาเรียกว่า Child Node ข้อดีคือมีความซับซ้อนน้อย มีโครงสร้างเข้าใจง่าย เรียงลำดับอย่างต่อเนื่อง ข้อจำกัด คือ การเข้าถึงข้อมูลมีความคล่องตัวน้อย เพราะต้องเริ่มจาก Root Segment เสมอ
- แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model) โครงสร้างเป็นลักษณะ Multi-list Structure มีความสัมพันธ์ของข้อมูลแบบ Many to Many แต่ละชั้นมี Segment สามารถมี Parent ได้มากกว่าหนึ่ง เรียก Parent ว่า Owner ส่วน Child เรียกว่า Member ความซ้ำซ้อนของข้อมูลมีน้อย สามารถเชื่อมโยงข้อมูลแบบไป กลับได้ แต่จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ มีความยุ่งบากในการเปลี่ยนแปลงโครงสร้างข้อมูล
- แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model) โครงสร้างข้อมูลอยู่ในรูปแบบตาราง เรียกตารางว่า รีเลชั้น แต่ละรีเลชั่น ประกอบด้วย แถวหรือทัพเพิล และคอลัมน์ เรียกว่า แอตทริบิวต์ แต่ละรีเลชั่นจะมีแอตทริบิวต์ เรียกว่า คีย์ บอกถึงความแตกต่างของแต่ละทัพเพิล เป็นโครงสร้างที่เข้าใจง่าย ข้อมูลมีความเป็นอิสระจากโปรแกรม
ระบบฐานข้อมูลแบบกระจาย (Distributed Database)
ฐานข้อมูลแบบกระจาย อาศัยซอฟต์แวร์ในการจัดการข้อมูล ซึ่งอำนวยความสะดวกให้แก่ผู้ใช้งานบนฐานข้อมูลแบบกระจาย การจัดเก็บข้อมูลสอดคล้องกับลักษณะการใช้งานจริง เรียกข้อมูลได้เร็ว
ฐานข้อมูลแบบออบเจ็กต์ (Object-Oriented Database)
ฐานข้อมูลเชิงวัตถุเกิดจากแนวคิดการเขียนโปรแกรมเชิงวัตถุ เพื่อการจัดเก็บข้อมูลที่มีความซับซ้อน ขนาดใหญ่ หลากหลาย จัดเก็บข้อมูลที่ประกอบด้วยแอตทริบิวต์ ซึ่งแสดงคุณสมบัติ รายละเอียดของข้อมูล และเมธอด ซึ่งแสดงฟังก์ชั่นพื้นฐานที่ประมวลผลกับข้อมูลภายนอกออบเจ็กต์นั้น กลุ่มของออบเจ็กต์มีคุณสมบัติ และพฤติกรรมที่เหมือนกันจะจัดอยู่ในคลาสเดียวกัน
ระบบจัดการฐานข้อมูลแบบออบเจ็กต์สามารถเก็บข้อมูลพื้นฐานทั่วไป ข้อมูลวัตถุ ข้อมูลมัลติมีเดียได้ง่าย แต่ไม่รวดเร็วเท่าระบบฐานข้อมูลแบบเชิงสัมพันธ์ ปัจจุบันจึงพัฒนาฐานข้อมูลแบบออบเจ็กต์และฐานข้อมูลเชิงสัมพันธ์มาใช้ร่วมกัน
คลังข้อมูล (Data Warehouse)
คลังข้อมูล เรียกว่า ดาต้าแวร์เฮาส์ คือที่เก็บรวบรวมข้อมูลจากหลายแหล่ง หลายชนิดเข้าด้วยกัน เป็นฐานข้อมูลขนาดใหญ่ขององค์การ ข้อมูลได้มาจากในองค์การ ภายนอกองค์การ ซึ่งได้รับการเลือก กลั่นกรอง การปรับแก้ไข ทำให้เป็นมาตรฐานเดียวกัน เพื่อให้ผู้ใช้สามารถเข้าถึงข้อมูลได้อย่างสะดวกรวดเร็ว
ลักษณะของข้อมูล
· การแบ่งโครงสร้างตามเนื้อหา (Subject Oriented) โดยการจัดเก็บข้อมูลที่สนใจและเป็นประโยชน์มาประมวลผลเพื่อสนับสนุนการตัดสินใจ
· การรวบรวมเป็นหนึ่งเดียว (Integration) รวบรวมข้อมูลให้อยู่ในรูปแบบมาตรฐานเดียวกัน
· ความสัมพันธ์กับเวลา (Time Variant) ข้อมูลที่จัดเก็บในคลังต้องกำหนดช่วงเวลา
· ความเสถียรของข้อมูล (Nonvolatile) ข้อมูลที่ถูกบันทึกไว้ในคลังข้อมูลไม่มีการเปลี่ยนแปลงค่าข้อมูลที่มีอยู่
ดาต้ามาร์ท (Data Mart)
การจัดทำดาต้ามาร์ท คือ คลังข้อมูลขนาดเล็กที่มีลักษณะเฉพาะสำหรับใช้ในองค์การธุรกิจ ดาต้ามาร์ทมีขนาดของข้อมูล และค่าใช้จ่ายที่ต่ำกว่า การจัดทำข้อมูลใช้เวลาสั้นกว่า การนำไปประยุกต์ใช้ในการพัฒนาระบบสนับสนุนการตัดสินใจภายในหน่วยงานสะดวกว่าใช้คลังข้อมูลกลางขององค์การ
ธุรกิจอัจฉริยะ (Business Intelligence: BI)
เป็นการใช้ข้อมูลขององค์การที่มีคุณค่าช่วยสนับสนุนการตัดสินใจการดำเนินงานของธุรกิจ เกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล การค้นพบโอกาสใหม่ ๆ ในการดำเนินการธุรกิจ กระบวนการของธุรกิจอัฉริยะ คือ การสนับสนุนการตัดสินใจ การคิวรี การรายงาน การประมวลผลเชิงวิเคราะห์แบบออนไลน์ การวิเคราะห์ทางสถิติ
การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล
มี 2 ประเภท คือ
- การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP) OLAP เป็นเครื่องมือที่มีความสามารถการค้นหา และการวิเคราะห์ข้อมูลจากคลังข้อมูล ในลักษณะต่าง ๆ เช่น
– การหมุนมิติ (Rotation) การวิเคราะห์ ดูข้อมูลหลายมิติ หลายมุมมอง
– การเลือกช่วงข้อมูล (Ranging) สามารถเลือกดูข้อมูลเฉพาะส่วนที่สนใจ และนำมาวิเคราะห์ได้โดยไม่ใช้ข้อมูลทั้งหมด
– การเลือกระดับชั้นของข้อมูล (Hierarchy) สามารถจัดแบ่งข้อมูลเป็นลำดับชั้น เพื่อให้เรียกดูข้อมูลจากระดับบนแล้วไประดับล่าง ดูรายละเอียดได้ - ดาต้าไมนิ่ง (Data Mining) เป็นเครื่องมือและเทคนิคในการสกัดข้อมูล และประมวลผลข้อมูลเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลใหญ่ สามารถค้นหารูปแบบ แนวโน้ม พฤติกรรม ความสัมพันธ์ที่ซ่อนอยู่ภายในข้อมูลเพื่อให้ได้ความรู้ใหม่
ความแตกต่างระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ
ฐานข้อมูลปฏิบัติการ (Operational Database) เป็นระบบที่ช่วยรวบรวม และจัดเก็บข้อมูล ซึ่งข้อมูลเพิ่มมากขึ้นเรื่อย ๆ ในแต่ละวัน การประมวลผลข้อมูลที่มีปริมาณมากจะใช้เวลานาน กระทบต่อการดำเนินงานได้ การเรียกดูข้อมูลต่าง ๆ ทำได้ไม่ง่าย ต้องอาศัยเวลาในการประมวลผล ไม่สามารถวิเคราะห์ข้อมูลในรูปแบบต่างๆ จึงมีการจัดทำคลังข้อมูลเพ่อเป็นแหล่งเก็บข้อมูลรวมขององค์การ ให้มีความเรียบง่ายต่อการค้นหา และเรียกใช้ได้อย่างรวดเร็ว สามารถรองรับการวิเคราะห์ข้อมูลที่มีปริมาณมาก ข้อมูลมีลักษณะจัดเก็บในลักษณะที่รวบรวม เป็นระเบียบตามเนื้อหา และแปรผันตามเวลา ข้อมูลซ้ำซ้อนได้ เหมาะกับการประมวลผลเชิงวิเคราะห์ที่เป็นประโยชน์
รูปแบบการประยุกต์คลังข้อมูลในธุรกิจ
ระบบคลังข้อมูลนี้ เรียกว่า GWIS (Glaxo Wellcome Information system) เป็นระบบที่ได้รับการพัฒนาด้วยเทคโนโลยีการวิเคราะห์ข้อมูลเชิงสัมพันธ์แบบออนไลน์ (Relational Online Analytical Processing :ROLAP) ช่วยสนับสนุนการตัดสินใจโดย GWIS ทำงานร่วมกับข้อมูลที่จัดเก็บในระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ และบูรณาการเข้ากันกับข้อมูลจากแหล่งภายใน และแหล่
https://pimpanp.wordpress.com/2008/04/26/บทที่-3-ฐานข้อมูล-และคลัง/
ไม่มีความคิดเห็น:
แสดงความคิดเห็น