data-science
ผู้เขียนกำลังสนใจในเรื่องของการวิเคราะห์ข้อมูล แล้วเจอคอร์สสอนออนไลน์ ของมหาวิทยาลัยแห่งหนึ่ง เลยสนใจจะนำมาสรุปหัวข้อและคำค้นหาต่างๆที่จะสามารถนำไปค้นคว้าหาข้อมูลต่อไปได้
อ่านต่อบทบาทของงานด้านนี้ส่วนมากจะอยู่ในงานด้านการทำธุรกิจ เช่น งานวางแผนธุรกิจ แผนการตลาด การวิจัย ที่จะเป็นต้องนำข้อมูลมาวิเคราะห์เพื่อให้ได้สารสนเทศมาตอบสนองความต้องการและพฤติกรรมของผู้บริโภค โดยทักษะที่จำเป็นจะประกอบไปด้วย หลาย ๆ ทักษะรวมกัน เช่น การรวบรวมข้อมูล การจัดการข้อมูล แปลงข้อมูลให้อยู่ในรูปแบบนำมาใช้งานได้ง่าย สถิติ อัลกอริทึมและซอฟต์แวร์ที่เป็นเครื่องมือทางเทคโนโลยีต่าง ๆ machine learning การสื่อสาร การนำเสนอด้วยรูปภาพ
อ่านต่อการคิดเชิงวิพากษ์เป็นทักษะการคิดที่มีลำดับการคิดอย่างเป็นขั้นเป็นตอน สามารถฝึกฝนกันได้ซึ่งคนที่สามารถคิดแบบเชิงวิพากษ์ได้นั้น จะเป็นคนที่สามารถเชื่อมโยงข้อมูลต่าง ๆ เพื่อสรุปผลลัพธ์จากสิ่งที่รู้และเข้าใจวิธีใช้ประโยชน์จากข้อมูลที่มีอยู่เพื่อแก้ไขปัญหาต่าง ๆ รวมถึงการคิดอย่างมีเหตุมีผล มีการจัดลำดับความคิด โดยไม่ใช้อารมณ์กับความรู้สึกในการจัดการสิ่งต่าง ๆ ซึ่งจะช่วยให้เข้าใจและจัดการสถานการณ์ตามข้อเท็จจริง ช่วยให้ตัดสินใจได้ดีและรอบคอบมากยิ่งขึ้น
อ่านต่อจากที่ได้เกริ่นเรื่องการดึงข้อมูลจากแหล่งข้อมูล (Data Collection) ไปในบท สรุปหน้าที่ของนักวิทยาศาสตร์ข้อมูลและกระบวนการทางวิทยาการข้อมูล นั้น จะมาลงรายละเอียดในเรื่องนี้กันให้ลึกขึ้นอีกสักนิด ว่าในขั้นตอนนี้ มีกระบวนการอะไรบ้างที่เกี่ยวข้อง ลองเข้ามาทำความเข้าใจกัน
อ่านต่อวิดีโอสาธิตการประยุกต์โปรแกรมการนับจำนวนนิ้วมือและภาษามือโดยใช้ Webcam สำหรับบทความนี้ เป็นการนำความรู้ที่ได้มาประยุกต์เพิ่มขึ้นอีกเล็กน้อยต่อบทความที่แล้ว
อ่านต่อLinear Algebra เป็นศาสตร์หนึ่งในสาขาคณิตศาสตร์ ที่เกี่ยวกับสมการเชิงเส้น และคุณสมบัตรการเปลี่ยนแปลงของสมการเชิงเส้น ไม่ว่าจะเป็น แผนภาพเชิงเส้น (Linear maps) เมทริกซ์ (Matrix) และ เวคเตอร์ที่จะพูดถึงในบทความนี้ (Vector Spaces) จะนำมาแปลงเป็น code โปรแกรมที่เขียนด้วย python
อ่านต่อสมมติว่าเรามีข้อมูลและปัญหา อยู่ชุดหนึ่งที่มีตั้งแต่ 2 ตัวแปรขึ้นไป ในการแก้ปัญหาเราจะนำข้อมูลมา plot ลงในกราฟตาราง แล้วหาความสัมพันธ์ เพื่อได้ค่าที่ต้องการทราบ แต่วิธีนี้ค่อนข้างจะลำบากและใช้เวลานาน นักคณิตศาสตร์จึงคิดค้นเทคนิคต่างๆ เพื่อให้ง่ายในการคำนวณ ลองมาดูโจทย์สักตัวอย่าง
อ่านต่อปัจจุบันมีเว็บไซต์มากมายให้สามารถเข้าถึงข้อมูล โดยเป้าหมายและเหตุผล ก็แตกต่างกันไปตามลักษณะการนำไปใช้งาน อย่างเช่น การทำข้อมูลเสริมเพื่อการตัดสินใจ โดยการสร้าง Model Machine Learning เพื่อช่วยในการตัดสินใจ มาดูกันว่าทั้ง 5 ข้อมีอะไรบ้าง
อ่านต่อการ binning เป็นการจัดกลุ่มที่มีจำนวนมากๆ และ มีความต่อเนื่อง อย่างเช่น Linear Regression กลุ่มข้อมูลเพื่อตรวจสอบข้อผิดพลาดของข้อมูลที่อยู่ในช่วงเล็กๆ โดยกำหนดกลุ่มค่า bin เอาไว้เพื่อเป็นตัวแทนของกลุ่มข้อมูลที่เราสนใจ
อ่านต่อในบทความนี้เป็นเรื่องราวที่อ่านจากหนังสือเล่มหนึ่งเป็นบทที่ผู้เขียนชื่นชอบมากที่สุด แล้วอยากนำมาสรุปใจความมาเล่าต่อแก่ผู้อ่านทุกท่านที่สนใจในเรื่องของ data ได้อ่านกัน ใครกันที่เป็นผู้ปลุกกระแส หม้อทอดไร้น้ำมันให้ตื่นขึ้น ผมเป็นตัวแทนที่จะย่อยใจความหนังสือ ของคุณ ณัฐพล ม่วงทํา ในบทนี้มาให้ได้อ่านกัน
อ่านต่อสำหรับบทความนี้เป็นการสรุปบทความที่นำ case study หนึ่งที่เล่าให้เห็นถึงความสำคัญของการเก็บรวบรวมข้อมูลหรือการทำ sale report เพื่อไปใช้ประโยชน์ต่อยอดในอนาคตซึ่งผมเป็นตัวแทนที่จะย่อยใจความหนังสือของคุณ ณัฐพล ม่วงทํา ในบทนี้มาให้ได้อ่านกัน
อ่านต่อสำหรับบทความนี้เป็นการสรุปบทความที่นำ case study หนึ่งที่น่าสนใจว่าห้างสรรพสินค้าในอเมริการู้ได้อย่างไรว่าใครตั้งครรภ์ ซึ่งผมเป็นตัวแทนที่จะย่อยใจความหนังสือของคุณ ณัฐพล ม่วงทํา ในบทนี้มาให้ได้อ่านกัน
อ่านต่อสำหรับบทความนี้เป็นการสรุปบทความที่นำ case study ที่เหมาะสำหรับพ่อค้าแม่ขายที่ใช้งานระบบ E-Commerce ชื่อดังกันอยู่ ซึ่งผมเป็นตัวแทนที่จะย่อยใจความหนังสือของคุณ ณัฐพล ม่วงทํา ในบทนี้มาให้ได้อ่านกัน
อ่านต่อในช่วงเวลานี้คงไม่มีใครที่ไม่รู้จัก midjourney ที่เรียกเสียงหือหาภาพวาดจากจินตนาการของ AI ที่นำภาพต่างที่ได้จาก Keyword ที่ป้อนให้มาสร้างเป็นภาพวาด ทั้งยังมีคนหัวใสนำเอาภาพที่ได้จาก AI นี้ไปประกวดจนชนะรางวัลที่ 1 มาแล้ว เนื่องจาก Artificial Intelligence หรือ AI ได้มีการเติบโตอย่างต่อเนื่องในหลายปีที่ผ่านมา และยังคงจะแตกแขนงไปอีกโดยสังเกตได้จาก Tech Giant หรือ Tech Startup ที่พยายามพัฒนา AI Application ที่มีความสามารถใหม่ออกมา 8 ทักษะมีอะไรบ้างมาดูกันเลย
อ่านต่อถ้าต้องการเข้าใจว่าสถิติหมายความว่าอะไร ก่อนอื่นควรจะต้องตั้งคำถามก่อนว่าประเด็นของปัญหาคืออะไร ก่อนที่จะเริ่มต้นศึกษาและรวบรวมข้อมูล แล้วจึงไปใช้เครื่องมือทางสถิติเพราะว่ามันจะช่วยให้เข้าใจและได้คำตอบ
อ่านต่อหลายๆคนน่าจะรู้จักกันดี กับเครื่องมือทางสถิติอย่างพวก ร้อนละ ค่าเฉลี่ย ค่ากลาง ค่าความแปรปรวน ต่างๆ เครื่องมือเหล่านี้ล้วนเป็นเครื่องมือที่อยู่ในกลุ่ม Descriptive statistic ทั้งสิ้น ซึ่งจะเป็นเครื่องมือที่ใช้ในการอธิบายข้อมูลที่อยู่รูปแบบของค่าสถิติหรือตัวเลขยากๆ สรุปให้อยู่ในรูปแบบที่สามารถอธิบายและเข้าใจได้ง่ายขึ้น
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน Google Sheet ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน Google Sheet ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน Google Sheet ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน Google Sheet ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน SQL ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน SQL ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน SQL ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน SQL ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน RStudio และ R Programming ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน RStudio และ R Programming ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน RStudio และ R Programming ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกการใช้งาน RStudio และ R Programming ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกวิธีสรุปข้อมูลเพื่อนำไปสร้างกราฟ Ghaph/Chart ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกวิธีสรุปข้อมูลเพื่อนำไปสร้างกราฟ Ghaph/Chart ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกวิธีสรุปข้อมูลเพื่อนำไปสร้างกราฟ Ghaph/Chart ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อสำหรับบทความนี้จะเป็นการบันทึกวิธีสรุปข้อมูลเพื่อนำไปสร้างกราฟ Ghaph/Chart ที่จำเป็นในการใช้งานสำหรับ Data Science เป็นพื้นฐานที่สำคัญ
อ่านต่อคำแนะนำจากผู้เขียน - ใครที่สนใจในเรื่องข้อมูล วิชาสถิติถือว่าเป็น foundation ของเรื่องนี้ สำหรับบทความนี้ เป็นสรุปบันทึกการเรียนวิชา statistic 101 สำหรับนักวิทยาศาสตร์ข้อมูล - sprint 05 ขอให้เครดิตแก่ Data Rockie ผู้เปิดโลกทัศน์วิชาด้านข้อมูล โดยที่ผู้เขียนเคยเรียนแล้วไม่เข้าใจแต่ เรียนกับคอร์สนี้แล้วเข้าใจ
อ่านต่อคำแนะนำจากผู้เขียน - ใครที่สนใจในเรื่องข้อมูล วิชาสถิติถือว่าเป็น foundation ของเรื่องนี้ สำหรับบทความนี้ เป็นสรุปบันทึกการเรียนวิชา statistic 102 สำหรับนักวิทยาศาสตร์ข้อมูล - sprint 05 ขอให้เครดิตแก่ Data Rockie ผู้เปิดโลกทัศน์วิชาด้านข้อมูล โดยที่ผู้เขียนเคยเรียนแล้วไม่เข้าใจแต่ เรียนกับคอร์สนี้แล้วเข้าใจ
อ่านต่อคำแนะนำจากผู้เขียน - ใครที่สนใจในเรื่องข้อมูล วิชาสถิติถือว่าเป็น foundation ของเรื่องนี้ สำหรับบทความนี้ เป็นสรุปบันทึกการเรียนวิชา statistic 103 สำหรับนักวิทยาศาสตร์ข้อมูล - sprint 05 ขอให้เครดิตแก่ Data Rockie ผู้เปิดโลกทัศน์วิชาด้านข้อมูล โดยที่ผู้เขียนเคยเรียนแล้วไม่เข้าใจแต่ เรียนกับคอร์สนี้แล้วเข้าใจ
อ่านต่อคำแนะนำจากผู้เขียน - ใครที่สนใจในเรื่องข้อมูล วิชาสถิติถือว่าเป็น foundation ของเรื่องนี้ สำหรับบทความนี้ เป็นสรุปบันทึกการเรียนวิชา statistic 104 สำหรับนักวิทยาศาสตร์ข้อมูล - sprint 05 ขอให้เครดิตแก่ Data Rockie ผู้เปิดโลกทัศน์วิชาด้านข้อมูล โดยที่ผู้เขียนเคยเรียนแล้วไม่เข้าใจแต่ เรียนกับคอร์สนี้แล้วเข้าใจ
อ่านต่อDashboard หรือ BI Tool เป็นเครื่องมือที่จะช่วยให้ User เห็นสิ่งที่จะช่วย Business Value เราดีขึ้น หรือ สามารถตัดสินใจเพื่อวัตถุประสงค์บางอย่างที่ Dashboard ต้องการจะบอกเรา
อ่านต่อทำไมต้องทำ feature engineering เรามักจะได้ยินคำนี้อยู่บ่อยๆ ในงานด้าน machine learning แต่มันคืออะไร ทำไปทำไม
อ่านต่อDevops มีเป้าหมายที่จะปรับปรุงและควบคุมคุณภาพเพื่อการส่งมอบโปรดักท์ที่มีคุณค่าได้อย่างรวดเร็ว ที่มุ่งเน้นในงาน software products เท่านั้น ส่วน Dataops จะมีกระบวนการทำงานที่คล้ายกันกับ Devops แต่มีเป้าหมาย มุ่งเน้นในงานด้าน Data products เท่านั้น
อ่านต่อเมื่อโพสที่แล้ว เราพูดถึงการเปลี่ยนข้อมูลจากภาษาของมนุษย์ เปลี่ยนให้เป็นภาษาที่คอมพิวเตอร์หรือเครื่องสามารถอ่านค่าได้ ก็คือตัวเลข แต่ในโพสนี้จะพูดถึงวิธีจัดการค่าว่าง เพื่อไม่ให้เกิดข้อผิดพลาดตามที่กล่าวมาข้างต้น
อ่านต่อจากโพสที่แล้ว เมื่อเราทำการ cleansing data จนได้ระดับที่น่าพอใจแล้ว สิ่งถัดไปที่จะต้องพิจารณาเพิ่มเติม จะขอเขียนในโพสนี้อยู่ 2 เรื่อง คือ 1. การกระจายตัวของข้อมูล (Data Distribution) 2. สเกลของข้อมูล และ การปรับเปลี่ยนข้อมูลให้มีสเกลเดียวกัน ซึ่งทั้งสองเรื่องนี้ เป็นสิ่งสำคัญที่จะต้องทำก่อนที่จะนำข้อมูลไปสร้างเป็น Model Machine learning
อ่านต่อExploration Data Analysis เป็นกระบวนการสำรวจข้อมูลเบื้องต้น เพื่อทำความรู้จักกับข้อมูลที่มีอยู่ โดยพิจารณาข้อมูลในมุมมองต่างๆ ช่วยให้สามารถระบุปัญหาและข้อผิดพลาดในข้อมูล ช่วยให้สามารถค้นพบข้อมูลเชิงลึกใหม่ๆ ที่ซ่อนอยู่ในข้อมูล
อ่านต่อสำหรับโพสต์นี้เป็นการ recap หรือ ทวนซ้ำอีกครั้งในการใช้ SQL เพื่อการตัดสินใจในการใช้ข้อมูล เป็น บทความต่อเนื่องจาก การสำรวจข้อมูลด้วย SQL ซึ่งจะมีการใช้คำสั่งพื้นฐานที่ช่วยให้เราเข้าใจความหมายที่อยู่ในข้อมูล เพื่อนำไปสู่การหาคำตอบบางอย่างที่ต้องการรู้
อ่านต่อในโพสต์ที่ผ่านๆ มาเป็นการนำชุดข้อมูลตัวอย่างมาทำความเข้าใจด้วยวิธีทางสถิติในการคำนวนค่าเพื่อสรุปออกมา โดยใช้วิธีการสำรวจข้อมูล สรุปข้อมูล และ นำไปตัดสินใจในบางเรื่องเพื่อใช้ประโยชน์ ประเด็นที่จะเขียนถึงในบทความต่อไปนี้ เป็นประเด็นการนำข้อมูลที่เราสรุปมาทำให้เป็นภาพ
อ่านต่อการสื่อสาร หรือ การเล่าเรื่อง ไม่ได้จำกัดอยู่แค่เพียงบางอาชีพ เป็นทักษาที่ทุกคนต้องมี ไม่ว่าจะเป็น นักธุรกิจ นักขาย นักเจรจาต่อรอง ครู อาจารย์ นักเรียน นักศึกษา PM PO ผู้บริหารทั้งหลาย ผู้ใช้ข้อมูลทั้งหลาย หรือ นักเทคนิคต่างๆ เช่น programmer ทุกคนล้วนมีความรู้และมีข้อมูลของตัวเอง แต่วิธีจะสื่อสารให้อีกฝ่ายเข้าใจนั้น จะทำอย่างไร
อ่านต่อนการจัดการข้อมูลต่างๆ เราใช้การเขียนโปรแกรมเข้ามาช่วยให้เกิดความสะดวกสบายมากขึ้น โดยเฉพาะการทำงานซ้ำๆ พิมพ์ข้อความซ้ำๆ การตัดคำซ้ำๆ การต่อคำซ้ำๆ การทำอะไรซ้ำๆ โดยที่มนุษย์ขี้เกียจอย่างเราก็ต้องหาเครื่องมือมาช่วยให้ชีวิตของเราไม่มาวุ่นวาย ก็การเขียนโปรแกรมนี้แหละ โดยเฉพาะเรื่องของการจำ บางอย่างสมองของมนุษย์ ไม่สามารถจำอะไรได้ทั้งหมด ต้องใช้การจดบันทึกมาช่วยในการจำ คอมพิวเตอร์ก็มีส่วนที่ต้องใช้ ความจำ เช่นเดียวกัน
อ่านต่อสำหรับโลกของการพัฒนาซอฟต์แวร์นั้นมีหลายภาษามากมาย และ ในแต่ละภาษาก็ล้วนมีเอกลักษณ์เฉพาะตัว มีการใช้งานที่แตกต่างกัน ซึ่ง Mobile Application ก็ภาษาหนึ่ง การเขียน Website ก็ภาษาหนึ่ง หรือแม้แต่การทำ Server Computer ก็อีกภาษาหนึ่ง แต่อย่างไรก็ตาม มีสิ่งหนึ่งที่ไม่ได้ต่างกันนั้นคือ “กระบวนการคิด”
อ่านต่อข้อมูลประเภทวันที่และเวลา (Datetime) เป็นข้อมูลที่สามารถกำหนดให้เกิดขึ้น เปลี่ยนแปลง หรือ การลบออกไป ของ สิ่งต่างๆที่ต้องการกำหนด พูดง่ายๆก็คือ มีข้อมูลประเภทวันที่และเวลามีอยู่รอบตัวเรา
อ่านต่อเรื่องการจัดการกับ string หรือ ข้อมูลต่างๆ ไม่ว่าจะเป็น การปรับแต่ง การแบ่งข้อความยาวๆ ให้สั้นลง การรวมข้อความให้ยาวขึ้น การประยุกต์ ตัดข้อความที่ต้องการแล้วเอามารวมกัน รวมถึงการตัดทิ้งด้วยเงื่อนไขต่างๆ และ ยิ่งไปกว่านั้นสามารถค้นหาคำในข้อความ แทนที่ นับคำต่างๆ จากที่ได้เกริ่น การจัดการข้อความนั้นสำคัญ สำหรับภาษา python แล้วมีเทคนิควิธีหลายอย่าง เพื่อความสะดวกในการจัดการ และ ใช้เทคนิคที่เหมาะสมกับปัญหา ไม่ว่าจะเป็น การใช้ String Template การ Regular Expression
อ่านต่อ