วิทยาศาสตร์ข้อมูล sklsongkiat.com หมวดหมู่บทความ




Image

สรุปกระบวนการทางวิทยาการข้อมูล

ผู้เขียนกำลังสนใจในเรื่องของการวิเคราะห์ข้อมูล แล้วเจอคอร์สสอนออนไลน์ ของมหาวิทยาลัยแห่งหนึ่ง เลยสนใจจะนำมาสรุปหัวข้อและคำค้นหาต่างๆที่จะสามารถนำไปค้นคว้าหาข้อมูลต่อไปได้

อ่านต่อ
Image

สรุปหน้าที่ของนักวิทยาศาสตร์ข้อมูลและกระบวนการทางวิทยาการข้อมูล

บทบาทของงานด้านนี้ส่วนมากจะอยู่ในงานด้านการทำธุรกิจ เช่น งานวางแผนธุรกิจ แผนการตลาด การวิจัย ที่จะเป็นต้องนำข้อมูลมาวิเคราะห์เพื่อให้ได้สารสนเทศมาตอบสนองความต้องการและพฤติกรรมของผู้บริโภค โดยทักษะที่จำเป็นจะประกอบไปด้วย หลาย ๆ ทักษะรวมกัน เช่น การรวบรวมข้อมูล การจัดการข้อมูล แปลงข้อมูลให้อยู่ในรูปแบบนำมาใช้งานได้ง่าย สถิติ อัลกอริทึมและซอฟต์แวร์ที่เป็นเครื่องมือทางเทคโนโลยีต่าง ๆ machine learning การสื่อสาร การนำเสนอด้วยรูปภาพ

อ่านต่อ
Image

สรุปการคิดเชิงวิพากษ์ หรือ critical thinking

การคิดเชิงวิพากษ์เป็นทักษะการคิดที่มีลำดับการคิดอย่างเป็นขั้นเป็นตอน สามารถฝึกฝนกันได้ซึ่งคนที่สามารถคิดแบบเชิงวิพากษ์ได้นั้น จะเป็นคนที่สามารถเชื่อมโยงข้อมูลต่าง ๆ เพื่อสรุปผลลัพธ์จากสิ่งที่รู้และเข้าใจวิธีใช้ประโยชน์จากข้อมูลที่มีอยู่เพื่อแก้ไขปัญหาต่าง ๆ รวมถึงการคิดอย่างมีเหตุมีผล มีการจัดลำดับความคิด โดยไม่ใช้อารมณ์กับความรู้สึกในการจัดการสิ่งต่าง ๆ ซึ่งจะช่วยให้เข้าใจและจัดการสถานการณ์ตามข้อเท็จจริง ช่วยให้ตัดสินใจได้ดีและรอบคอบมากยิ่งขึ้น

อ่านต่อ
Image

Data pipeline แท้จริงแล้วมันคืออะไร

จากที่ได้เกริ่นเรื่องการดึงข้อมูลจากแหล่งข้อมูล (Data Collection) ไปในบท สรุปหน้าที่ของนักวิทยาศาสตร์ข้อมูลและกระบวนการทางวิทยาการข้อมูล นั้น จะมาลงรายละเอียดในเรื่องนี้กันให้ลึกขึ้นอีกสักนิด ว่าในขั้นตอนนี้ มีกระบวนการอะไรบ้างที่เกี่ยวข้อง ลองเข้ามาทำความเข้าใจกัน

อ่านต่อ
Image

Review Book : Fundamental of Deep learning in practice

ผู้เขียน เห็นเนื้อหาในหนังสืออยู่บทนึงที่น่าสนใจ และคิดว่าสามารถนำมาประยุกต์ใช้กับงานในอนาคตได้ จึงตัดสินใจซื้อหนังสือเล่มนี้มาแล้วลงมือทำตามขั้นตอนและคำแนะนำในหนังสือทุกขั้นตอน หลังจากที่ได้ลงมือทำทุกบท จนจบแล้ว จึงนำมารีวิวให้เผื่อมีใครกำลังจะตัดสินใจซื้อหนังสือเล่มนี้ ผู้เขียนคิดว่า หนังสือเล่มนี้ จัดว่าเป็นหนังสือที่ดีเล่มหนึ่ง สำหรับผู้ที่สนใจในด้าน ​Machine learning, Deep learning ระดับพื้นฐาน

อ่านต่อ
Image

มาหาข้อมูลความสัมพันธ์ของแต่ละ user กันเถอะ

หลังจากที่กำเนิด platform ที่มีชื่อว่า Facebook มาหลายปี นับตั้งแต่ 2009 จนถึงปัจจุบัน 2022 ก็บริษัท Facebook ก็เริ่มเปลี่ยนเป้าหมายของบริษัท ไปทำระบบ Metaverse หลายๆคนอาจจะเคยสงสัยว่า เวลาที่ ระบบที่เรียกกันว่า Social Network และกิจกรรมที่เรียกกันเพิ่มเพื่อนๆ มีขั้นตอนหรือการทำงานอย่างไร

อ่านต่อ
Image

มาดูทฤษฎีเวกเตอร์ ที่เขียนด้วยไพธอนกันเถอะ

Linear Algebra เป็นศาสตร์หนึ่งในสาขาคณิตศาสตร์ ที่เกี่ยวกับสมการเชิงเส้น และคุณสมบัตรการเปลี่ยนแปลงของสมการเชิงเส้น ไม่ว่าจะเป็น แผนภาพเชิงเส้น (Linear maps) เมทริกซ์ (Matrix) และ เวคเตอร์ที่จะพูดถึงในบทความนี้ (Vector Spaces) จะนำมาแปลงเป็น code โปรแกรมที่เขียนด้วย python

อ่านต่อ
Image

Linear Algebra ใครบอกว่าเรียนมาไม่ได้ใช้ ว่าด้วยเรื่องการแก้สมการด้วย Matrix ใน Machine Learning

สมมติว่าเรามีข้อมูลและปัญหา อยู่ชุดหนึ่งที่มีตั้งแต่ 2 ตัวแปรขึ้นไป ในการแก้ปัญหาเราจะนำข้อมูลมา plot ลงในกราฟตาราง แล้วหาความสัมพันธ์ เพื่อได้ค่าที่ต้องการทราบ แต่วิธีนี้ค่อนข้างจะลำบากและใช้เวลานาน นักคณิตศาสตร์จึงคิดค้นเทคนิคต่างๆ เพื่อให้ง่ายในการคำนวณ ลองมาดูโจทย์สักตัวอย่าง

อ่านต่อ
Image

พื้นฐาน 5 ข้อที่ควรรู้ ในการทำ Web Scraping

ปัจจุบันมีเว็บไซต์มากมายให้สามารถเข้าถึงข้อมูล โดยเป้าหมายและเหตุผล ก็แตกต่างกันไปตามลักษณะการนำไปใช้งาน อย่างเช่น การทำข้อมูลเสริมเพื่อการตัดสินใจ โดยการสร้าง Model Machine Learning เพื่อช่วยในการตัดสินใจ มาดูกันว่าทั้ง 5 ข้อมีอะไรบ้าง

อ่านต่อ
Image

สรุป case study ว่าด้วยเรื่องความสำคัญของ sale report

สำหรับบทความนี้เป็นการสรุปบทความที่นำ case study หนึ่งที่เล่าให้เห็นถึงความสำคัญของการเก็บรวบรวมข้อมูลหรือการทำ sale report เพื่อไปใช้ประโยชน์ต่อยอดในอนาคตซึ่งผมเป็นตัวแทนที่จะย่อยใจความหนังสือของคุณ ณัฐพล ม่วงทํา ในบทนี้มาให้ได้อ่านกัน

อ่านต่อ
Image

สรุปเรื่องดูข้อมูลการซื้อสินค้าบอกได้ว่าใครตั้งครรภ์

สำหรับบทความนี้เป็นการสรุปบทความที่นำ case study หนึ่งที่น่าสนใจว่าห้างสรรพสินค้าในอเมริการู้ได้อย่างไรว่าใครตั้งครรภ์ ซึ่งผมเป็นตัวแทนที่จะย่อยใจความหนังสือของคุณ ณัฐพล ม่วงทํา ในบทนี้มาให้ได้อ่านกัน

อ่านต่อ
Image

8 ทักษะที่จำเป็นงานด้าน AI Engineer

ในช่วงเวลานี้คงไม่มีใครที่ไม่รู้จัก midjourney ที่เรียกเสียงหือหาภาพวาดจากจินตนาการของ AI ที่นำภาพต่างที่ได้จาก Keyword ที่ป้อนให้มาสร้างเป็นภาพวาด ทั้งยังมีคนหัวใสนำเอาภาพที่ได้จาก AI นี้ไปประกวดจนชนะรางวัลที่ 1 มาแล้ว เนื่องจาก Artificial Intelligence หรือ AI ได้มีการเติบโตอย่างต่อเนื่องในหลายปีที่ผ่านมา และยังคงจะแตกแขนงไปอีกโดยสังเกตได้จาก Tech Giant หรือ Tech Startup ที่พยายามพัฒนา AI Application ที่มีความสามารถใหม่ออกมา 8 ทักษะมีอะไรบ้างมาดูกันเลย

อ่านต่อ
Image

เราทำ dashboard ไปเพื่ออะไร และ หลักการทำ dashboard ที่ดีทำอย่างไร

Dashboard หรือ BI Tool เป็นเครื่องมือที่จะช่วยให้ User เห็นสิ่งที่จะช่วย Business Value เราดีขึ้น หรือ สามารถตัดสินใจเพื่อวัตถุประสงค์บางอย่างที่ Dashboard ต้องการจะบอกเรา

อ่านต่อ
Image

Data Engineer ทำงานกับใครบ้าง

ในโพสนี้ มาชวนอ่าน “Data Engineer ทำงานกับใครบ้าง” โดยสรุปจากหนังสือ Fundamental of Data Engineer ซึ่งจะนำทักษะต่างๆ ที่สรุปเอาไว้ในโพสที่แล้ว มาใช้ในการทำงานร่วมกับ stake holder อื่นๆ ที่เกี่ยวข้องในธุรกิจ

อ่านต่อ
Image

การแก้ไขข้อมูลที่ขาดหาย ค่าว่างในชุดข้อมูล เพื่อประสิทธิภาพ machine learning

เมื่อโพสที่แล้ว เราพูดถึงการเปลี่ยนข้อมูลจากภาษาของมนุษย์ เปลี่ยนให้เป็นภาษาที่คอมพิวเตอร์หรือเครื่องสามารถอ่านค่าได้ ก็คือตัวเลข แต่ในโพสนี้จะพูดถึงวิธีจัดการค่าว่าง เพื่อไม่ให้เกิดข้อผิดพลาดตามที่กล่าวมาข้างต้น

อ่านต่อ
Image

สิ่งสำคัญของการสร้าง model ML คือการปรับข้อมูลให้ Normalization และ Scaling

จากโพสที่แล้ว เมื่อเราทำการ cleansing data จนได้ระดับที่น่าพอใจแล้ว สิ่งถัดไปที่จะต้องพิจารณาเพิ่มเติม จะขอเขียนในโพสนี้อยู่ 2 เรื่อง คือ 1. การกระจายตัวของข้อมูล (Data Distribution) 2. สเกลของข้อมูล และ การปรับเปลี่ยนข้อมูลให้มีสเกลเดียวกัน ซึ่งทั้งสองเรื่องนี้ เป็นสิ่งสำคัญที่จะต้องทำก่อนที่จะนำข้อมูลไปสร้างเป็น Model Machine learning

อ่านต่อ