การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด

Show

  • All Blogs
  • Products/Services
  • การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx
  • การทำความสะอาดข้อมูลด้วย Data Cleansing Tool ในโปรแกรม Alteryx

    ในการจัดการข้อมูล การทำ Data Cleansing (การทำความสะอาดข้อมูล) นั้น ถือเป็นขั้นตอนที่ใช้ระยะเวลานานที่สุด

    19 April, 2021 by

    Chinnawoot Toechamroen (Nic)

    | No comments yet

    Data Cleansing Tool Data Cleansing Tool เป็นเครื่องมือที่ใช้จัดการข้อมูลที่มีค่า null ด้วยการลบทิ้งทั้งแถวหรือแทนค่าด้วย 0 หรือช่องว่าง และยังใช้จัดการช่องว่าง ตัวหนังสือ ตัวเลข เครื่องหมายวรรคตอนต่างๆ รวมถึงรูปแบบตัวอักษรแบบตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็กอีกด้วย

                การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด
                การนำ Input Data มาเชื่อมต่อกับ Data Cleansing Tool ตัวเลือกต่างๆ ในเครื่องมือ มีดังนี้

                การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด

                1. ลบแถวที่มีค่าเป็น null ทั้งหมด หรือ ลบคอลัมน์ที่มีค่าเป็น null ทั้งหมดออก2. เลือกคอลัมน์ที่จะทำการคลีนข้อมูล ซึ่งจะเลือกทำตัวเลือกในข้อ 3 และ ข้อ 43. เลือกจัดการข้อมูลที่เลือกในข้อ 2 ได้ดังนี้          3.1 ลบช่องว่างข้างหน้า และข้างหลังออก          3.2 ลบแท็ป บรรทัดคั่นหน้า และช่องเว้นว่างที่เว้นมากกว่าหนึ่งช่องให้เหลือเพียงช่อง                    เดียว          3.3 ลบช่องว่างทั้งหมดออก          3.4 ลบตัวหนังสือทั้งหมดออก          3.5 ลบตัวเลขทั้งหมดออก          3.6 ลบเครื่องหมายวรรคตอนออก4. ปรับรูปแบบตัวอักษรให้เป็นตัวพิมพ์ใหญทั้งหมด ตัวพิมพ์เล็กทั้งหมด หรือตัวพิมพ์ใหญ่แค่ตัวแรก

                ตัวอย่างการใช้ Data Cleansing Tool

                การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด


                จากรูปด้านบนเป็นตัวอย่างข้อมูลที่จะใช้เป็นตัวอย่าง ข้อมูลจะมีบางช่องที่มีค่า null หรือช่องว่าง ทั้งข้างหน้าหรือข้างหลังของคำ

                ตัวอย่างที่ 1 เปลี่ยนค่า null ในคอลัมน์ Score ให้เป็นค่า 0

                การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด

                การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด

                ตัวอย่างที่ 2 เปลี่ยนค่า null ในคอลัมน์ที่เลือกเป็นช่องว่าง และลบช่องว่างข้างหน้ากับข้างหลังออก จะเห็นว่าในคอลัมน์ Score จะไม่เปลี่ยนค่า null เป็นช่องว่าง เพราะตัวเลือกนั้นจะทำเฉพาะข้อมูลที่เป็น String

                ตัวอย่างที่ 3 ในคอลัมน์ Term เปลี่ยนค่า null ในข้อมูล String เป็น ช่องว่าง และในข้อมูลตัวเลขเปลี่ยนเป็น 0, ลบช่องว่างด้านหน้าและด้านหลังออก และลบตัวหนังสือทั้งหมดออก

                การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด

                การทำความสะอาดข้อมูล data cleaning อยู่ในขั้นตอนใด

                ตัวอย่างที่ 4 

                         ในคอลัมน์ Region จะจัดการลบช่องว่างข้างหน้ากับข้างหลังออก และเปลี่ยนรูปแบบเป็นอักษรตัวพิมพ์ใหญ่ทั้งหมด

                Chinnawoot Toechamroen (Nic) 19 April, 2021

                Share this post

                Tags

                Archive

                We use cookies to provide you a better user experience.

                การทําความสะอาดข้อมูลมีกี่ขั้นตอน

                ขั้นตอนเบื้องต้นในการ Clean ข้อมูล 4 ขั้นตอน ได้แก่.
                Parsing คือ การแจกแจงข้อมูล หรือการใช้หัวข้อของชุดข้อมูล ... .
                Correcting คือ การแก้ไขข้อมูลที่ผิดพลาด เช่น ในช่องเพศ มีการใส่ตัวเลข หรือแม้กระทั่งตัวเลขที่ผิดปกติไปเนื่องจากมี 0 เกินมา ก็เป็นได้.

                การทำความสะอาดข้อมูล (Data Cleansing) ต้องทำอย่างไร

                1. ลบแถวที่มีค่าเป็น null ทั้งหมด หรือ ลบคอลัมน์ที่มีค่าเป็น null ทั้งหมดออก 2. เลือกคอลัมน์ที่จะทำการคลีนข้อมูล ซึ่งจะเลือกทำตัวเลือกในข้อ 3 และ ข้อ 4 3. เลือกจัดการข้อมูลที่เลือกในข้อ 2 ได้ดังนี้ 3.1 ลบช่องว่างข้างหน้า และข้างหลังออก 3.2 ลบแท็ป บรรทัดคั่นหน้า และช่องเว้นว่างที่เว้นมากกว่าหนึ่งช่องให้เหลือเพียงช่อง ...

                ขั้นตอนการทําความสะอาดข้อมูล มี 4 ขั้นตอน อะไรบ้าง

                4 ขั้นตอนการทำความสะอาดข้อมูล ดังนี้ 1 Parsing คือ การแจกแจงข้อมูล 2 Correcting คือ การแก้ไขข้อมูลที่ผิดพลาด 3 Standardizing คือ การทำข้อมูลให้เป็นรูปแบบเดียวกัน และ 4 Duplicate Elimination คือ การลบชุดข้อความซ้ำซ้อนทิ้ง E0%B8%82%E0%B8%B1%E0%B9%89%E0%B8%99%E0%B8%95%E0%B8%AD%E0%B8%99%E0%B8%81%E0%B8%B2%E0%B8%A3-clean- ...

                ขั้นตอนที่ 2 ของการทำความสะอาดข้อมูลคืออะไร

                2. Correcting คือ การแก้ไขข้อมูลที่ผิดพลาด เช่น ในช่องเพศ มีการใส่ตัวเลข หรือแม้กระทั่งตัวเลขที่ผิดปกติไปเนื่องจากมี 0 เกินมา ก็เป็นได้ Correcting คือ การแก้ไขข้อมูลที่ผิดพลาด