[เล่นเพลง] DUSTIN TRAN: สวัสดี ดัสตินชื่อของฉัน ดังนั้นผมจะนำเสนอ การวิเคราะห์ข้อมูลในอาร์ เพียงเล็กน้อยเกี่ยวกับตัวเอง ฉันปัจจุบันนักศึกษาระดับบัณฑิตศึกษาใน วิศวกรรมศาสตร์และวิทยาศาสตร์ประยุกต์ ผมเรียนสี่แยก การเรียนรู้เครื่องและสถิติ การวิเคราะห์ข้อมูลเพื่อให้ในการวิจัยคือ พื้นฐานจริงๆสิ่งที่ ที่ฉันทำในชีวิตประจำวัน และ R คือโดยเฉพาะอย่างยิ่ง ที่ดีสำหรับการวิเคราะห์ข้อมูล เพราะมันเป็นเรื่องที่ดีมากสำหรับการสร้างต้นแบบ และมักจะเมื่อคุณกำลังทำอะไรบางอย่าง ของการวิเคราะห์ข้อมูลจำนวนมากที่มีปัญหา จะให้ความรู้ความเข้าใจ และเพื่อให้คุณเพียงแค่ต้องการที่จะมี บางภาษาที่ดีจริงๆที่ เป็นเพียงที่ดีสำหรับการทำ ฟังก์ชั่นเมื่อเทียบ ที่จะมีการจัดการกับสิ่งที่ระดับต่ำ ดังนั้นในการเริ่มต้นฉันแค่ไป ที่จะแนะนำสิ่งที่เป็น R, ทำไมจะ คุณต้องการที่จะใช้มันและ แล้วไปไปสู่​​การสาธิตบาง และเพียงแค่ไปจากที่นั่น ดังนั้นสิ่งที่เป็น R? R เป็นเพียงภาษาพัฒนา สำหรับการคำนวณทางสถิติ และการมองเห็น ดังนั้นสิ่งนี้หมายความว่า มันเป็นภาษาที่ยอดเยี่ยมมาก สำหรับการจัดเรียงของสิ่งที่มีข้อตกลงใด ๆ กับ ความไม่แน่นอนหรือข้อมูลการสร้างภาพ เพื่อให้คุณมีทั้งหมดเหล่านี้ การแจกแจงความน่าจะเป็น มีจะเป็นกำลัง ฟังก์ชั่น นอกจากนี้คุณยังจะได้มีความยอดเยี่ยม แพคเกจการวางแผน งูหลามเป็นอีกหนึ่งการแข่งขัน ภาษาสำหรับข้อมูล และสิ่งหนึ่งที่ผมพบว่า R จะดีกว่ามากที่เป็นการสร้างภาพ ดังนั้นสิ่งที่คุณจะเห็นในการสาธิตเป็น ดีเป็นเพียงภาษาใช้งานง่ายมาก ที่เพิ่งทำงานได้ดีมาก นอกจากนี้ยังเป็นฟรีและเปิดแหล่งที่มาเป็น เป็นภาษาใด ๆ ที่ดีอื่น ๆ ผมคิดว่า และที่นี่, พวงเพียง คำหลักที่คุณโยน มันเป็นแบบไดนามิกซึ่งหมายความว่าถ้าคุณมี ชนิดเฉพาะที่กำหนดให้วัตถุ กว่ามันก็จะเปลี่ยนได้ทันที มันขี้เกียจดังนั้นจึงเป็นสมาร์ทเกี่ยวกับ วิธีการที่จะไม่คำนวณ ฟังก์ชั่นความหมายจริงๆมันสามารถทำงานได้ ตามออกของฟังก์ชั่นเพื่อ anything-- การเรียงลำดับของการจัดการใด ๆ ที่คุณกำลัง การทำก็จะตามออกฟังก์ชั่น ผู้ประกอบการไบนารีดังนั้นสำหรับตัวอย่างเช่น เป็นเพียงการทำงานโดยเนื้อแท้ และทุกอย่างที่ คุณกำลังจะทำคือ จะต้องวิ่งออกจากฟังก์ชั่นของตัวเอง และแล้วเชิงวัตถุเช่นกัน ดังนั้นนี่คือพล็อต XKCD ไม่เพียงเพราะฉันรู้สึกเหมือน XKCD เป็นพื้นฐานในการเรียงลำดับใด ๆ ของงานนำเสนอ แต่เป็นเพราะ ฉันรู้สึกเช่นนี้จริงๆ ตอกจุดที่มากของ เวลาที่คุณกำลังทำเรียงลำดับของข้อมูลบางส่วน การวิเคราะห์ปัญหาที่เกิดขึ้นไม่ได้ มากวิธีที่รวดเร็วทำงาน แต่ระยะเวลามันจะ พาคุณไปยังโปรแกรมงาน ดังนั้นนี่เป็นเพียงการวิเคราะห์ว่า กลยุทธ์หรือมีประสิทธิภาพมากขึ้น นี้เป็นไปได้ บางสิ่งบางอย่างที่คุณ จะจัดการจำนวนมากที่มีอยู่ใน การเรียงลำดับของภาษาในระดับต่ำ ที่คุณจัดการกับความผิดพลาด seg, จัดสรรหน่วยความจำเริ่มต้นให้, ยังทำให้ฟังก์ชั่นในตัว และสิ่งนี้จะถูกจัดการทั้งหมด มากอย่างหรูหราในอาร์ ดังนั้นเพียงแค่ค้อนนี้ จุดคอขวดที่ใหญ่ที่สุด เป็นไปได้องค์ความรู้ การวิเคราะห์ข้อมูลดังนั้นเป็นปัญหาที่ยากมาก ไม่ว่าคุณกำลังทำ การเรียนรู้เครื่องหรือคุณ ทำเพียงแค่การจัดเรียงของบางอย่าง การสำรวจข้อมูลพื้นฐาน คุณไม่ต้องการที่จะมี ที่จะใช้เอกสาร และคอมไพล์แล้ว บางสิ่งบางอย่างทุกครั้งที่คุณ ต้องการที่จะเห็นสิ่งที่คอลัมน์ดูเหมือน โดยเฉพาะอย่างยิ่งสิ่งที่รายการในเมทริกซ์ ดูเหมือนว่า ดังนั้นคุณเพียงต้องการที่จะมี บางอินเตอร์เฟซที่ดีจริงๆ คุณสามารถเรียกใช้ฟังก์ชั่นที่เรียบง่าย ที่ดัชนีสิ่งที่ คุณต้องการและเพียงแค่เรียกใช้จากที่นั่น และคุณจะต้องโดเมน ภาษาที่เฉพาะเจาะจงสำหรับการนี​​้ และ R จริงๆจะช่วยให้คุณกำหนด ปัญหาและแก้ปัญหาได้ในลักษณะนี้ ดังนั้นนี่คือพล็อตแสดงการเขียนโปรแกรม ความนิยมของ R ที่มันหายไปเมื่อเวลาผ่านไป เพื่อที่คุณจะได้เห็นเช่น 2013 หรือ ดังนั้นมันก็พัดขึ้นอย่างมาก และนี้ได้รับเพียงเพราะการที่ แนวโน้มใหญ่ในอุตสาหกรรมเทคโนโลยี ข้อมูลขนาดใหญ่เกี่ยวกับ นอกจากนี้ไม่เพียง แต่เทคโนโลยี อุตสาหกรรม แต่จริงๆ that-- อุตสาหกรรมใด ๆ เพราะ จำนวนมากของอุตสาหกรรม มีการเรียงลำดับของพื้นฐาน พยายามที่จะแก้ปัญหาเหล​​่านี้ และมักจะคุณสามารถมีที่ดีบางอย่าง วิธีการวัดปัญหาเหล​​่านี้ หรือแม้กระทั่งการกำหนดพวกเขาหรือ การแก้พวกเขาโดยใช้ข้อมูล ดังนั้นผมคิดว่าตอนนี้ R คือ 11 ภาษาที่นิยมมากที่สุดใน TIOBE และจะได้รับการเจริญเติบโตตั้งแต่นั้นมา ดังนั้นนี่คือบางมากขึ้น คุณสมบัติของอาร์มันมี จำนวนมหาศาลของแพคเกจและ สำหรับทุกสิ่งที่แตกต่างกันเหล่านี้ ดังนั้นเวลาที่คุณต้อง ปัญหาบางอย่างมากที่สุด R เวลาจะมี ฟังก์ชั่นที่สำหรับคุณ ดังนั้นไม่ว่าคุณต้องการที่จะ สร้างการเรียงลำดับของเครื่องบาง ขั้นตอนวิธีการเรียนรู้ที่เรียกว่า ป่าสุ่มหรือต้นไม้ตัดสินใจ หรือแม้แต่พยายามที่จะใช้ค่าเฉลี่ยของ ฟังก์ชั่นหรือใด ๆ ของสิ่งนี้ R จะมีที่ และถ้าคุณทำคุณดูแลเกี่ยวกับ การเพิ่มประสิทธิภาพของสิ่งหนึ่งที่พบบ่อย คือว่าหลังจากที่คุณเสร็จสิ้นการสร้างต้นแบบ การจัดเรียงของบางภาษาระดับสูง, คุณจะโยนว่า in-- คุณจะเพียงพอร์ตว่ากว่า กับบางภาษาระดับต่ำ มีอะไรที่ดีเกี่ยวกับ R คือว่าเมื่อคุณ ทำต้นแบบนั้นคุณสามารถเรียกใช้ภาษา C ++ หรือ Fortran หรือใด ๆ เหล่านี้ คนที่ต่ำกว่าระดับโดยตรงในอาร์ นั่นคือใครจริงๆ คุณสมบัติเย็นเกี่ยวกับ R, ถ้าคุณจริงๆดูแลเกี่ยวกับ จุดเพิ่มประสิทธิภาพ และก็ยังดีจริงๆ สำหรับการสร้างภาพบนเว็บ ดังนั้น D3.js เช่นเป็น ผมคิดว่าการสัมมนาอื่น ที่เรานำเสนอในวันนี้ และนี้เป็นจริงที่น่ากลัวสำหรับ ทำการสร้างภาพแบบโต้ตอบ และ D3.js อนุมานว่าคุณมี การเรียงลำดับของข้อมูลบางอย่างจะได้รับการพล็อต และ R คือวิธีที่ดีของความสามารถในการทำ การวิเคราะห์ข้อมูลก่อนที่จะส่งออก ไป D3.js หรือแม้กระทั่งการทำงานเพียง D3.js คำสั่งเป็น R ตัวเอง เช่นเดียวกับทุกเหล่านี้ ห้องสมุดอื่น ๆ ได้เป็นอย่างดี ดังนั้นที่เป็นเพียงการแนะนำของ สิ่งที่เป็น R และเหตุผลที่คุณอาจจะใช้มัน ดังนั้นหวังว่าฉันได้ เชื่อว่าสิ่งที่คุณ เกี่ยวกับเพียงแค่พยายามที่จะเห็นสิ่งที่มันต้องการ ดังนั้นฉันจะไปข้างหน้าและผ่านไป ปัจจัยพื้นฐานบางอย่างเกี่ยวกับวัตถุ R และสิ่งที่คุณสามารถทำได้จริงๆ ดังนั้นนี่เป็นเพียง พวงของคำสั่งทางคณิตศาสตร์ ดังนั้นพูด you're-- คุณต้องการสร้าง ภาษาที่ตัวเองและคุณเพียงต้องการ ที่จะมีพวงของเครื่องมือที่แตกต่างกัน การเรียงลำดับของการดำเนินการใด ๆ ที่คุณคิดว่าคุณต้องการ ต้องการคือสวยมากจะอยู่ในอาร์ ดังนั้นนี่คือ 2 บวก 2 นี่คือครั้งที่ 2 ปี่ R มีพวงของในตัวคงที่ ที่คุณมักจะใช้เช่นปี่, E แล้วนี่คือ 7 บวก runif ดังนั้น runif 1 นี้เป็นฟังก์ชั่นที่สร้าง หนึ่งเครื่องแบบสุ่ม 0-1 แล้วมี 3 ถึงพลังของ 4 มีรากที่สองคือ มีการเข้าสู่ระบบเป็น ดังนั้นการเข้าสู่ระบบจะทำฐาน ชี้แจงด้วยตัวเอง แล้วถ้าคุณระบุฐานแล้ว คุณสามารถทำฐานสิ่งที่คุณต้องการ และแล้วนี่คือบางส่วนคำสั่งอื่น ๆ เพื่อให้คุณมี 23 สมัย 2 แล้วคุณมีส่วนที่เหลือ แล้วคุณมีทางวิทยาศาสตร์ สัญกรณ์ถ้าคุณยัง ต้องการที่จะทำมากขึ้นเพียงและ สิ่งที่ซับซ้อนมากขึ้น ดังนั้นนี่คือที่ได้รับมอบหมาย ที่ได้รับมอบหมายโดยทั่วไปดังนั้นใน R จะทำกับลูกศร ดังนั้นจึงเป็นเรื่องที่น้อยกว่าแล้วยัติภังค์ ดังนั้นที่นี่ฉันแค่กำหนด 3 Val ตัวแปร แล้วผมพิมพ์ออก Val และจากนั้นก็พิมพ์ออกสาม โดยค่าเริ่มต้นในล่าม R มัน สิ่งที่จะพิมพ์ออกมาให้คุณ ดังนั้นคุณจึงไม่ต้องระบุพิมพ์ Val เวลาที่คุณต้องการที่จะพิมพ์อะไรบางอย่างใด คุณก็สามารถทำ Val และ แล้วมันจะทำเพื่อคุณ นอกจากนี้คุณยังสามารถใช้เท่ากับในทางเทคนิค เป็นผู้ประกอบการที่ได้รับมอบหมาย มีรายละเอียดปลีกย่อยเล็กน้อยเป็น ระหว่างการใช้ลูกศร ผู้ประกอบการและเท่าเทียมกัน ผู้ประกอบการที่ได้รับมอบหมาย โดยส่วนใหญ่การประชุมทุกคน ก็จะใช้ประกอบการที่ลูกศร และที่นี่ผมกำหนดนี้ สัญกรณ์เฉียงเรียกว่า 1 ลำไส้ใหญ่ 6 นี้จะสร้างเวกเตอร์ 1-6 และนี่ดีจริงๆแล้วเพราะ คุณเพียงแค่กำหนดเวกเตอร์วาล และที่ทำงานด้วยตัวเอง ดังนั้นนี่เป็นที่เรียบร้อยแล้วไปจาก single-- ข้อมูลที่ใช้งานง่ายมาก โครงสร้างของเพียงสองเท่าของ บางประเภทของชนิดเป็นเวกเตอร์ และที่จะเก็บรวบรวมทั้งหมด ค่าสเกลาร์สำหรับคุณ ดังนั้นหลังจากที่ไปจากเกลาคุณ มีวัตถุ R และนี่คือเวกเตอร์ เวกเตอร์เป็นประเภทใด คอลเลกชันของชนิดเดียวกัน ดังนั้นนี่คือพวงของเวกเตอร์ ดังนั้นนี่คือตัวเลข ตัวเลขเป็นวิธีที่อาร์พูดว่าคู่ และอื่น ๆ โดยค่าเริ่มต้นใด ๆ ตัวเลขจะเป็นคู่ ดังนั้นถ้าคุณมีค 1.1, 3, เชิงลบ 5.7, c คือฟังก์ชั่น นี้เชื่อมทั้งสาม ตัวเลขเป็นเวกเตอร์ และนี่จะ be-- ดังนั้นหาก คุณสังเกตเห็น 3 ด้วยตัวเอง ปกติคุณจะถือว่า ที่นี้เป็นเหมือนจำนวนเต็ม แต่เนื่องจากเวกเตอร์ทั้งหมด เป็นประเภทเดียวกัน นี้เป็นเวกเตอร์ของคู่ หรือตัวเลขในกรณีนี้ rnorm เป็นฟังก์ชั่นที่สร้าง มาตรฐาน variables-- ปกติ หรือค่าปกติมาตรฐาน และฉันระบุสองของพวกเขา ดังนั้นฉันทำ rnorm 2 กำหนดว่า devs และจากนั้นผมพิมพ์ออก devs ดังนั้นเหล่านี้เป็นเพียงสอง ค่าปกติแบบสุ่ม และแล้ว ints ถ้าคุณทำ คุณดูแลเกี่ยวกับจำนวนเต็ม ดังนั้นนี่เป็นเพียงเกี่ยวกับหน่วยความจำ การจัดสรรและการประหยัดขนาดหน่วยความจำ ดังนั้นคุณจะต้องผนวก หมายเลขของคุณโดยทุนลิตร โดยทั่วไปนี้คือ สัญกรณ์ประวัติศาสตร์อาร์ สำหรับสิ่งที่เรียกว่าจำนวนเต็มยาว ดังนั้นเวลาส่วนใหญ่ของคุณจะ จะจัดการกับคู่ผสม และถ้าคุณเคยจะภายหลัง ในการเพิ่มประสิทธิภาพของรหัสของคุณ คุณก็สามารถเพิ่มเหล่านี้แอลเอ หลังจากนั้นหรือในระหว่างนั้น ถ้าคุณต้องการ precognitive เกี่ยวกับสิ่งที่ คุณกำลังจะทำตัวแปรเหล่านี้ ดังนั้นนี่คือเวกเตอร์ของตัวละคร ดังนั้นอีกครั้งฉันเชื่อมโยง สามสายในเวลานี้ ขอให้สังเกตว่าสายคู่และ สายเดียวเดียวกันในอาร์ ดังนั้นผมจึงมีอาเธอร์และมาร์วินและอื่น ๆ เมื่อฉันพิมพ์มันออกมาทั้งหมดของพวกเขา จะแสดงให้สายสอง และถ้าคุณยังต้องการที่จะรวมถึง สตริงคู่หรือเตียงเดี่ยว ในตัวละครของคุณแล้วคุณสามารถ ทั้งสลับสายของคุณ ดังนั้น marvin สำหรับ องค์ประกอบที่สองนี้เป็น จะ show-- คุณ เพียงแค่มีสายสอง แล้วสายเดียว ดังนั้นนี้จะสลับกัน มิฉะนั้นถ้าคุณต้องการใช้คู่ ประกอบสตริงในสตริงคู่ เมื่อคุณประกาศมันแล้ว คุณเพียงแค่ใช้ประกอบการหลบหนี ดังนั้นคุณทำเครื่องหมายทับขวาสตริงคู่ และในที่สุดเรายัง มีเวกเตอร์ตรรกะ ดังนั้น logical-- เพื่อ TRUE และเท็จและพวกเขากำลัง จะเป็นตัวพิมพ์ใหญ่ทั้งหมด และจากนั้นอีกครั้งฉันเชื่อมโยง พวกเขาแล้วการกำหนดให้พวกเขา bools ดังนั้น bools จะแสดง คุณ TRUE, FALSE และ TRUE ดังนั้นนี่คือการจัดทำดัชนี vectorized ดังนั้นในการเริ่มต้นผม กำลังการฟังก์ชัน นี้เรียกว่า sequence-- ลำดับที่ 2-12 และผมจะลำดับ 2 ดังนั้นมันจะทำ 2, 4, 6, 8, 10 และ 12 แล้วฉันทำดัชนี เพื่อให้ได้องค์ประกอบที่สาม ดังนั้นสิ่งหนึ่งที่จะเก็บไว้ในใจคือ ที่ดัชนี R โดยเริ่มต้นตั้งแต่วันที่ 1 ดังนั้น Vals 3 เป็นไปเพื่อให้ คุณองค์ประกอบที่สาม นี้คือการจัดเรียงที่แตกต่างจากคนอื่น ๆ ภาษาที่มันเริ่มต้นจากศูนย์ ดังนั้นใน C หรือ C ++ เช่นคุณ จะได้รับองค์ประกอบที่สี่ และนี่คือ Vals 3-5 ดังนั้นสิ่งหนึ่งที่เป็น เย็นจริงๆคือคุณ สามารถสร้างตัวแปรชั่วคราวภายใน แล้วก็ใช้พวกเขาในทันที ดังนั้นนี่คือ 3-5 ดังนั้นฉันสร้างเวกเตอร์ 3, 4 และ 5 แล้ว ฉันจะได้รับการจัดทำดัชนีที่สาม สี่และห้าองค์ประกอบ ดังนั้นทำนองเดียวกันคุณสามารถ นามธรรมนี้เพื่อทำ การเรียงลำดับใด ๆ ของเวกเตอร์ ที่ช่วยให้คุณจัดทำดัชนี ดังนั้นนี่คือ Vals แล้ว ครั้งแรกที่สามและองค์ประกอบที่หก แล้วถ้าคุณต้องการ ที่จะทำสมบูรณ์, ดังนั้นคุณก็ทำลบ และหลังจากนั้นที่จะ ให้ทุกสิ่งที่ไม่ ครั้งแรกที่สามหรือองค์ประกอบที่หก ดังนั้นนี้จะเป็น 4, 8 และ 10 และถ้าคุณต้องการที่จะได้รับ แม้จะสูงขึ้น คุณสามารถเชื่อมเวกเตอร์บูลีน ดังนั้นดัชนีนี้เป็นไปเพื่อให้คุณ นี้เวกเตอร์บูลีนที่มีความยาว 6 ดังนั้นตัวแทนจุลภาค TRUE 3 นี้จะทำซ้ำ TRUE สามครั้ง ดังนั้นนี้จะให้คุณ เวกเตอร์ TRUE, TRUE, TRUE ตัวแทน FALSE 4-- นี้จะให้คุณ เวกเตอร์ของเท็จเท็จเท็จเท็จ และแล้วคจะไปเชื่อม ทั้งสอง Booleans กัน ดังนั้นคุณจะได้รับสาม TRUEs แล้วสี่ falses เพื่อที่ว่าเมื่อคุณดัชนี Vals คุณ จะได้รับ TRUE, TRUE, TRUE เพื่อที่จะบอกว่าใช่ ฉันต้องการทั้งสามองค์ประกอบ และแล้วเท็จเท็จ เท็จเท็จที่เกิดขึ้น จะบอกว่าไม่มีผมไม่ต้องการองค์ประกอบเหล่านั้น ดังนั้นมันจะไม่กลับมา และผมคิดว่ามีจริง typo ที่นี่ เพราะไม่ว่าจะเป็นซ้ำ TRUE 3 และทำซ้ำ FALSE 4 และในทางเทคนิคคุณ มีเพียงหกองค์ประกอบเพื่อให้ทำซ้ำเท็จ ก็ควรที่จะทำซ้ำ FALSE 3 ผมคิดว่า R คือยังฉลาดพอที่ดังกล่าว ว่าถ้าคุณเพียงแค่ระบุ 4 ที่นี่แล้ว มันจะไม่ได้ข้อผิดพลาดออก มันก็จะทำให้คุณมีค่านี้ ดังนั้นมันก็จะไม่สนใจที่สี่เท็จ ดังนั้นนี่คือการกำหนด vectorized ดังนั้น set.seed-- นี้เพียงชุด เมล็ดพันธุ์สำหรับตัวเลข pseudorandom ดังนั้นฉันตั้งเมล็ด 42 ซึ่งหมายความว่าถ้าฉันสร้าง สามสุ่มปกติ ค่านิยมและแล้วถ้าคุณ วิ่ง set.seed ด้วยตัวคุณเอง เครื่องคอมพิวเตอร์โดยใช้ค่าเดียวกัน 42, แล้วคุณยังได้รับ เดียวกันสามปกติแบบสุ่ม ดังนั้นนี่เป็นสิ่งที่ดีจริงๆ สำหรับการทำสำเนา โดยปกติเมื่อคุณกำลังทำบางอย่าง การเรียงลำดับของการวิเคราะห์ทางวิทยาศาสตร์ คุณต้องการที่จะตั้งค่าเมล็ดพันธุ์ วิธีการที่นักวิทยาศาสตร์อื่น ๆ สามารถเพียง ทำซ้ำรหัสเดียวกันแน่นอนคุณได้ ทำเพราะพวกเขาจะมีที่แน่นอน ตัวแปรสุ่ม that-- เดียวกันหรือแบบสุ่ม ค่าที่คุณได้นำออกมาได้เป็นอย่างดี และเพื่อให้การกำหนด vectorized ที่นี่มีการแสดง Vals 1-2 ดังนั้นมันจะใช้เวลาสองคนแรกองค์ประกอบ ของ Vals แล้วกำหนดให้พวกเขา 0 แล้วคุณยังสามารถทำ สิ่งที่คล้ายกับ Booleans ดังนั้น Vals ไม่เท่ากับ 0-- นี้จะ ให้คุณ FALSE เวกเตอร์, FALSE, TRUE ในกรณีนี้ และจากนั้นก็จะพูดใด ๆ ของดัชนีที่เป็นจริง จากนั้นก็จะกำหนดว่าถึง 5 ดังนั้นจึงต้องใช้องค์ประกอบที่สาม ที่นี่แล้วมันกำหนดถึง 5 และนี่เป็นสิ่งที่ดีจริงๆ เทียบกับภาษาระดับต่ำ ที่คุณจะต้องใช้สำหรับการลูป ที่จะทำทุกสิ่ง vectorized นี้ เพราะมันเป็นเพียงแค่การใช้งานง่ายมาก และเป็นหนึ่งเดียวซับ และสิ่งที่เกี่ยวกับการที่ดี สัญกรณ์ vectorized คือว่าในการวิจัยเหล่านี้จะเรียงลำดับของ ในตัวเพื่อให้พวกเขาเกือบจะเป็นไปอย่างรวดเร็ว ที่ทำในภาษาระดับต่ำเป็น เมื่อเทียบกับการทำห่วงในการวิจัย แล้วต้องให้ทำ การจัดทำดัชนีแบบไดนามิกตัวเอง และที่ว่าจะช้ากว่าการทำ เรียงลำดับของสิ่ง vectorized นี้ ที่มันสามารถทำมันได้ในแบบคู่ขนานที่ ก็ทำในเธรดพื้น ดังนั้นนี่คือการดำเนินงาน vectorized ดังนั้นฉันสร้างมูลค่า 1-3, กำหนดว่าจะ vec1, 3-5, vec2, การเพิ่มพวกเขาร่วมกัน พวกเขาจะเพิ่มองค์ประกอบที่ชาญฉลาดเพื่อให้ มันเป็น 1 บวก 3, 2 บวก 4 และอื่น ๆ vec1 ครั้ง vec2 นี้คูณสอง ค่าฉลาดส่วนประกอบ ดังนั้นจึงเป็นที่ 1 ครั้งที่ 3 ครั้งที่ 2 4 แล้ว 3 ครั้ง 5 และแล้วในทำนองเดียวกันคุณยังสามารถทำ เปรียบเทียบตรรกะ comparisons-- ดังนั้นจึงเป็นเท็จเท็จจริงในเรื่องนี้ เพราะกรณีที่ 1 ไม่เกิน 3 2 ไม่เกิน 4 นี่คือฉันเดาพิมพ์ผิดอีก 3 ไม่แน่นอนมากขึ้นกว่า 5 ใช่ และเพื่อให้คุณก็สามารถทำทุกอย่าง เหล่านี้การดำเนินงานที่เรียบง่าย เพราะได้รับมรดกของพวกเขา จากชั้นเรียนของตัวเอง เพื่อให้เป็นเพียงแค่เวกเตอร์ และนั่นคือการจัดเรียงของพื้นฐานที่สุด วัตถุ R เพราะได้รับเวกเตอร์ คุณสามารถสร้างวัตถุที่สูงขึ้น ดังนั้นนี่คือเมทริกซ์ นี้เป็นหลักที่เป็นนามธรรม ของสิ่งที่เมทริกซ์เป็นตัวเอง ดังนั้นในกรณีนี้ก็แตกต่างกันสาม เวกเตอร์ที่แต่ละคนเป็นคอลัมน์ หรือคุณสามารถพิจารณามัน เป็นหนึ่งในแต่ละแถว ดังนั้นฉันเก็บเมทริกซ์จาก 1 ถึง 9 และจากนั้นฉันระบุ 3 แถว ดังนั้น 1-9 จะให้เวกเตอร์ที่ 1, 2, 3, 4, 5, 6, และทุกวิธีการที่ 9 สิ่งหนึ่งที่ยังเก็บไว้ในใจก็คือว่า R ค่าร้านค้าในรูปแบบคอลัมน์ที่สำคัญ ดังนั้นในคำอื่น ๆ เมื่อคุณเห็น 1 ถึง 9 ก็จะเก็บ them-- มันเป็นไปได้ที่ 1, 2, 3 ในคอลัมน์แรก และจากนั้นก็จะทำ 4, 5, 6 ในคอลัมน์ที่สอง แล้ว 7, 8, 9 ในคอลัมน์ที่สาม และนี่คือบางส่วนอื่น ๆ การทำงานร่วมกันที่คุณสามารถใช้ ดังนั้นเสื่อสลัวนี้จะให้คุณ ขนาดของเมทริกซ์ มันจะกลับมาที่คุณ เวกเตอร์ของมิติ ดังนั้นในกรณีนี้เพราะ เมทริกซ์ของเราคือ 3 จาก 3 มันจะทำให้คุณ เวกเตอร์ที่เป็นตัวเลขที่ 3 3 และนี่ก็เป็นเพียงการแสดง คูณเมทริกซ์ ดังนั้นโดยปกติถ้าคุณเพียงแค่ทำ asterisk-- เพื่อเสื่อดอกจัน mat-- นี้เป็นไปได้ การดำเนินงานองค์ประกอบที่ชาญฉลาด หรือสิ่งที่เรียกว่าผลิตภัณฑ์ Hadamard ดังนั้นมันจะทำในแต่ละ องค์ประกอบองค์ประกอบฉลาด แต่ถ้าคุณต้องการ เมทริกซ์ multiplication-- ดังนั้นการคูณครั้งแถวแรก คอลัมน์แรกเมทริกซ์ที่สองของ และเพื่อให้ on-- ที่คุณจะใช้ การดำเนินงานร้อยละนี้ และเสื้อของเสื่อเป็นเพียง การดำเนินงานไขว้ ดังนั้นฉันพูดใช้ไขว้ใน เมทริกซ์, คูณด้วยเมทริกซ์ ตัวเอง และจากนั้นก็จะ กลับไปยังคุณอีก 3 3 แสดงเมทริกซ์ ผลิตภัณฑ์ที่คุณต้องการ และเพื่อให้เป็นเมทริกซ์ นี่คือสิ่งที่เรียกว่ากรอบข้อมูล กรอบข้อมูลที่คุณสามารถคิดเป็น เมทริกซ์ แต่แต่ละคอลัมน์ตัวเอง เป็นไปได้ของรูปแบบที่แตกต่างกัน ดังนั้นสิ่งที่ยอดเยี่ยมเกี่ยวกับข้อมูลจริงๆ เฟรมที่อยู่ในการวิเคราะห์ข้อมูลของตัวเอง คุณกำลังจะมีทั้งหมดนี้ ข้อมูลต่างกันและสิ่งเหล่านี้จริงๆ สิ่งที่ยุ่งที่แต่ละคอลัมน์ ตัวเองสามารถที่แตกต่างกัน ดังนั้นที่นี่ฉันพูดสร้าง กรอบข้อมูลทำ ints 1-3, แล้วยังมีเวกเตอร์ของตัวละคร ดังนั้นผมจึงสามารถจัดทำดัชนีผ่าน แต่ละคอลัมน์เหล่านี้ แล้วฉันจะได้รับค่าตัวเอง และคุณยังสามารถทำอะไรบางอย่าง ของการดำเนินงานในเฟรมข้อมูล และส่วนใหญ่ของเวลาเมื่อคุณอยู่ ทำการวิเคราะห์ข้อมูลหรือการจัดเรียงบาง preprocessing ของคุณจะ การทำงานร่วมกับโครงสร้างข้อมูลเหล่านี้ ที่แต่ละคอลัมน์จะ จะเป็นชนิดที่แตกต่างกัน จึงพอสรุปเหล่านี้เป็นหลักเพียง สี่วัตถุสำคัญในรายชื่ออาร์ เพียงแค่จะเก็บใด ๆ วัตถุอื่น ๆ ที่คุณต้องการ ดังนั้นมันจะเก็บเรื่องนี้เป็นหนึ่งใน ตัวแปรที่คุณสามารถเข้าถึงได้อย่างง่ายดาย ดังนั้นที่นี่ฉันสละรายการ สิ่งที่ฉันพูดเท่ากับ 3 ดังนั้นฉันจะมีองค์ประกอบหนึ่งใน รายการและนี้เรียกว่าสิ่งที่ และมันจะมีค่า 3 ฉันยังสามารถสร้างเมทริกซ์ ดังนั้นนี่คือ 1-4 และท้ายแถว เท่ากับ 2 ดังนั้น 2 คูณ 2 เมทริกซ์ นอกจากนี้ในรายการและก็เรียกว่าเสื่อ moreStuff สตริงตัวอักษร และแม้กระทั่งรายการอื่นในตัวเอง ดังนั้นนี่คือรายการที่ 5 และหมี ดังนั้นมันจึงมีค่า 5 และมัน มีตัวละครหมีสตริง และเป็นรายการภายในรายการ ดังนั้นคุณจึงสามารถมีเหล่านี้ สิ่งที่เรียกซ้ำ คุณมี another-- พิมพ์ภายในชนิด ดังนั้นในทำนองเดียวกันคุณสามารถมีเมทริกซ์ ภายในเมทริกซ์อีกและอื่น ๆ และรายการเป็นเพียงวิธีที่ดี ของการเก็บรวบรวมและการรวมกัน ทั้งหมดเหล่านี้วัตถุที่แตกต่าง และในที่สุดที่นี่เป็นเพียงการช่วยในกรณี นี้ก็หายไปเพียงอย่างรวดเร็ว ดังนั้นเวลาที่คุณกำลังสับสน เกี่ยวกับการจัดเรียงของฟังก์ชั่นบางอย่าง คุณสามารถทำความช่วยเหลือของฟังก์ชั่นที่ ดังนั้นคุณจึงสามารถจะช่วยเมทริกซ์ หรือเมทริกซ์เครื่องหมายคำถาม และความช่วยเหลือและเครื่องหมายคำถามอยู่ เพียงแค่จดชวเลขสำหรับสิ่งเดียวกัน เพื่อให้พวกเขาแทน LM เป็นฟังก์ชั่นที่ ไม่เพียงแค่รูปแบบเชิงเส้น แต่ถ้าคุณมีความคิดว่า ผลงานคุณก็สามารถทำความช่วยเหลือของ LM และบอกว่าจะให้คุณบาง การเรียงลำดับของเอกสารที่ มีลักษณะเหมือนกับ หน้าคนในยูนิกซ์ที่ คุณมีคำอธิบายสั้น ๆ ของสิ่งที่ มันไม่ยังมีสิ่งที่อาร์กิวเมนต์เป็น สิ่งที่มันกลับมาและเพียงแค่เคล็ดลับในการ ที่จะใช้มันและตัวอย่างบางส่วนเช่นกัน เพื่อให้ฉันไปข้างหน้าและการแสดง การสาธิตการใช้อาร์ตกลงบางอย่าง ดังนั้นผมจึงเดินไปมาก ได้อย่างรวดเร็วเพียงแค่ข้อมูล โครงสร้างและการจัดเรียงของบางอย่าง op-- บางส่วนของการดำเนินงาน นี่คือการทำงานบางอย่าง ดังนั้นที่นี่ฉันแค่ไป เพื่อกำหนดฟังก์ชั่น ดังนั้นฉันยังมีการใช้ ผู้ประกอบการที่ได้รับมอบหมายที่นี่ แล้วที่ฉันพูด ประกาศว่ามันเป็นฟังก์ชั่น และจะใช้เวลาค่า x ดังนั้นนี่คือค่าใด ๆ ที่คุณต้องการ และฉันจะกลับ x ตัวเอง ดังนั้นนี่คือการทำงานของตัวตน และสิ่งที่เย็นเกี่ยวกับเรื่องนี้ เมื่อเทียบกับภาษาอื่น ๆ และอีกระดับต่ำ ภาษาคือ x สามารถเป็นชนิดใด ๆ ของตัวเอง และมันจะกลับมาแบบนั้น ดังนั้นคุณจึงสามารถ imagine-- เพื่อให้ ผมทำงานนี้ได้อย่างรวดเร็ว ขอโทษ ดังนั้นสิ่งหนึ่งที่ฉันควรพูดถึง คือการที่แก้ไขนี้ผมใช้ เรียกว่า rstudio นี้คือสิ่งที่เรียกว่า IDE และสิ่งหนึ่งที่ ดีจริงๆเกี่ยวกับเรื่องนี้ คือว่ามันรวมเอาจำนวนมาก สิ่งที่คุณต้องการจะทำในการวิจัยด้วยตัวเอง เพียงแค่สังหรณ์ใจมาก ดังนั้นนี่คือคอนโซลล่าม ดังนั้นในทำนองเดียวกันคุณยังสามารถได้รับนี้ คอนโซลดิบเพียงด้วยการทำทุนอาร์ และนี่คือว่า สิ่งเดียวกับคอนโซล ดังนั้นผมก็สามารถทำฟังก์ชั่น id x, x, x และ then-- แล้วว่า จะปรับตัวเอง rstudio ดังนั้นที่ดี เพราะมันมีคอนโซล นอกจากนี้ยังมีเอกสาร คุณต้องการที่จะทำงานใน แล้วมันมีตัวแปรบาง ที่คุณสามารถมองเห็นในสภาพแวดล้อม แล้วถ้าคุณมี ที่จะทำแปลงแล้วคุณ ก็สามารถดูได้ที่นี่เมื่อเทียบกับ การจัดการหน้าต่างที่แตกต่างกันเหล่านี้ ด้วยตัวเอง ที่จริงผมใช้บุคคลที่เป็นกลุ่ม แต่ฉัน รู้สึกเหมือน rstudio เป็นเลิศเพียง สำหรับการรับความคิดที่ดี ของวิธีการใช้อาร์ปกติ เมื่อคุณกำลังพยายามที่จะ เรียนรู้บางงานใหม่ คุณไม่ต้องการที่จะจัดการกับ สิ่งที่มากเกินไปในครั้งเดียว ดังนั้น R เป็นเพียง rstudio very-- เป็นวิธีที่ดีมากของการเรียนรู้ R โดยไม่ต้องมีการจัดการกับ ทุกสิ่งอื่น ๆ เหล่านี้ ดังนั้นที่นี่ฉันกำลังทำงาน id สวัสดี ผลตอบแทนที่ได้นี้สวัสดี id 123 นี่คือเวกเตอร์ของจำนวนเต็มคือ ดังนั้นในทำนองเดียวกันเพราะคุณสามารถ ใช้การเรียงลำดับใด ๆ บางส่วนของมูลค่า คุณสามารถทำกลับ id ของ x เพื่อให้มันกลับ 1234 และ 5 และแจ้งให้เราเพียงแค่แสดงให้คุณเห็นว่า นี่เป็นจำนวนเต็ม และในทำนองเดียวกันถ้าคุณทำชั้น id x, มันจะเป็นจำนวนเต็ม แล้วคุณยังสามารถ เปรียบเทียบทั้งสองและมันเป็นความจริง ดังนั้นฉันตรวจสอบหาก id ของ x เท่ากับเท่ากับ x และแจ้งให้ทราบล่วงหน้า ว่ามันจะช่วยให้คุณสอง TRUEs ดังนั้นนี้ไม่ได้บอกว่าเป็น วัตถุทั้งสองเหมือนกัน แต่แต่ละรายการ ภายในเวกเตอร์เหมือนกัน นี่คือ bounded.compare ดังนั้นนี่คือซับซ้อนกว่าเล็กน้อย ในการที่จะมีถ้าเงื่อนไขและอื่น ๆ และจากนั้นก็จะใช้เวลาสอง ข้อโต้แย้งในเวลา ดังนั้น x เป็นประเภทใด และฉันก็พูดอย่างนี้ อาร์กิวเมนต์ที่สองคือ นี้สามารถเป็นอะไรก็ได้เช่นกัน แต่โดยปกติก็จะใช้เวลา 5 ถ้าคุณไม่ได้ระบุอะไร ดังนั้นที่นี่ฉันจะบอกว่า ถ้า x มากกว่า ดังนั้นถ้าฉันไม่ได้ระบุมัน กล่าวว่าถ้า x มากกว่า 5 แล้วฉันจะกลับ TRUE อื่นฉันจะกลับเท็จ เพื่อให้ฉันไปข้างหน้าและกำหนดนี้ และตอนนี้ฉันกำลังจะไป ทำงาน bounded.compare 3 ดังนั้นจึงกล่าวว่าเป็นที่ 3 น้อย than-- 3 สูงกว่า 5 ไม่มีก็ไม่ได้ FALSE และ bounded.compare 3 และฉันจะ เพื่อเปรียบเทียบโดยใช้เท่ากับ 2 ดังนั้นตอนนี้ฉันพูดใช่ตอนนี้ฉัน ต้องการที่จะเป็นอย่างอื่น ดังนั้นฉันจะบอกว่าคุณควรจะ 2 ฉันสามารถจะทำเรียงลำดับของการนี​​้ สัญกรณ์หรือผมบอกว่าเท่ากับ 2 นี่คือการอ่านได้มากขึ้น ในการที่เมื่อคุณอยู่ มองไปที่เหล่านี้จริงๆ ฟังก์ชั่นที่ซับซ้อนที่ ใช้เวลาหลาย arguments-- นี้ สามารถนับสิบ oftentimes-- แค่บอก เท่ากับ 2 สามารถอ่านได้มากขึ้นสำหรับ เพื่อให้คุณในภายหลังในอนาคต คุณจะรู้ว่าสิ่งที่คุณทำ ดังนั้นในกรณีนี้ผม คำกล่าวที่ว่าคือ 3 มากกว่า 2 ใช่มันเป็น และในทำนองเดียวกันผมก็สามารถลบ นี้และกล่าวว่าเป็น 3 มากกว่า 2 ซึ่งเท่ากับ 2 และที่ยังเป็นจริง ใช่? ผู้ชม: คุณ ดำเนินการทีละบรรทัด? DUSTIN TRAN: ใช่ผม ดังนั้นสิ่งที่ฉันทำที่นี่ การข้อความนี้ document-- และสิ่งที่ดีเกี่ยวกับ rstudio คือ ฉันเพียงแค่สามารถทำงาน short-- คีย์ลัด ดังนั้นฉันทำควบคุมใส่ แล้วฉันสละ บรรทัดในเอกสารข้อความ แล้ววางในคอนโซล ดังนั้นที่นี่ฉันพูด, bounded.compare และที่ฉันทำควบคุม-X ดังนั้นผมก็สามารถจะเรียกที่นี่เช่นกัน และแล้วที่จะนำ สายแล้ววางไว้ที่นี่ และแล้วในทำนองเดียวกันผมสามารถจะเรียกที่นี่ และแล้วมันก็จะช่วยให้การกำหนด สายเข้าไปในคอนโซลเช่นนั้น และถ้าคุณสังเกตเห็นหยิก การจัดฟันจะมีเช่นเดียวกับในไวยากรณ์ C ค่า x ถ้าหากสภาพยังเป็น จะใช้วงเล็บแล้ว คุณสามารถใช้อื่น อีกคนหนึ่งเป็นอื่นถ้า ดังนั้นนี่เป็นไปได้ x เท่ากับเท่ากับตัวอย่างเช่น และจากนั้นผมกำลังจะไป กลับบางสิ่งบางอย่างที่นี่ ขอให้สังเกตว่ามีสองที่แตกต่างกัน สิ่งที่นี่ที่เกิดขึ้น หนึ่งคือการที่นี่ฉันระบุ กลับค่า TRUE นี่ฉันแค่บอก x ดังนั้น R จะมักจะตามค่าเริ่มต้น ใช้ arguments-- ล่าสุด หรือใช้บรรทัดสุดท้ายของรหัส และนั่นจะเป็นสิ่งที่มันกลับมา ดังนั้นที่นี่เหมือนกัน สิ่งที่ทำผลตอบแทน x และเพียงเพื่อแสดงให้คุณเห็น และจากนั้นก็จะทำงานเช่นเดียวกับที่ เพื่อให้ฉันยังคงมีนี้ ดังนั้นถ้าอื่น และจริงๆผมสามารถกลับ อะไรที่ฉันต้องการ ดังนั้นผมจึงไม่ได้มีการ ผลตอบแทน Booleans ตลอดเวลา ฉันเพียงแค่สามารถกลับอย่างอื่น ดังนั้นผมจึงสามารถทำหมีกลับมา ดังนั้นหาก x เท่ากับเท่ากับ, มันจะกลับหมี มิฉะนั้นก็จะกลับ TRUE ฉันยังสามารถทำเวกเตอร์ หรืออะไรจริงๆ และตามปกติในแบบคงที่ ภาษาพิมพ์, คุณจะต้องระบุประเภทที่นี่ และแจ้งให้ทราบว่ามันก็สามารถเป็นอะไรก็ได้ และ R คือฉลาดพอที่จะ ก็จะทำเช่นนี้และมันจะทำงานได้ดี เพื่อให้ฉันกำหนดนี้ Unexpected-- โอ้ขอโทษ มันควรจะเป็นวงเล็บปีกกาที่นี่ ตกลง เย็น สิทธิ์ทั้งหมด ดังนั้นตอนนี้เราลองมาเปรียบเทียบและ 3 เท่ากับ 3 ดังนั้นจึงควร return-- yeah-- หมีค่า ดังนั้นตอนนี้สิ่งที่ทั่วไปมากขึ้นเป็นเหมือน สิ่งที่เกี่ยวกับโครงสร้างข้อมูลอื่น ๆ เพื่อให้คุณมีฟังก์ชั่นนี้ นี้จะไปทำงานในการจัดเรียงใด ๆ ของมูลค่าเช่น 3 หรือตัวเลขใด ๆ ในคำอื่น ๆ คู่ แต่สิ่งที่เกี่ยวกับสิ่งที่ต้องการเวกเตอร์ ดังนั้นสิ่งที่เกิดขึ้นถ้าคุณ do-- ดังนั้นฉัน จะกำหนด Val เพื่อพูด, 4-6 ดังนั้นถ้าผมกลับมาที่นี้ เป็นเวกเตอร์จาก 4, 5, 6 ตอนนี้ขอดูสิ่งที่เกิดขึ้น ถ้าฉันไม่ bounded.compare Val ดังนั้นนี้จะให้คุณ 15 1251 ดังนั้นในคำอื่น ๆ ก็บอกว่า หากดูสภาพนี้ ดังนั้นจึงกล่าวว่า x น้อย กว่าหรือบางสิ่งบางอย่าง ดังนั้นนี่คือเล็กน้อย ทำให้เกิดความสับสนเพราะตอนนี้ คุณก็ไม่ทราบว่าสิ่งที่เกิดขึ้น ดังนั้นผมคิดว่าสิ่งหนึ่งที่จริงๆ ที่ดีเกี่ยวกับเพียงแค่พยายามที่จะแก้ปัญหา คือการที่คุณก็สามารถทำ Val เป็นมากขึ้น กว่าและดูสิ่งที่เกิดขึ้นที่นั่น ดังนั้น val-- คือการเริ่มต้น 5 ดังนั้น ขอเพียงแค่ไม่ Val มากกว่า 5 ดังนั้นนี่คือเวกเตอร์เท็จเท็จ TRUE ดังนั้นตอนนี้เมื่อคุณกำลังมองหาที่ นี้ก็จะบอกว่าถ้า และจากนั้นก็จะให้คุณนี้ เป็นเวกเตอร์ของเท็จเท็จ TRUE ดังนั้นเมื่อคุณผ่านนี้เป็น R, R มีความคิดสิ่งที่คุณทำไม่มี เพราะคาดว่าหนึ่งเดียว ค่าซึ่งเป็นบูลีนและตอนนี้ คุณกำลังให้มันเวกเตอร์ของ Booleans ดังนั้นโดยเริ่มต้นงานวิจัยเป็นเพียง จะพูดห่า, ฉันจะคิดว่าคุณ จะใช้องค์ประกอบแรกที่นี่ ดังนั้นฉันจะ say-- ฉันจะ ที่จะคิดว่านี้เป็นเท็จ ดังนั้นมันจะบอกว่า ไม่มีนี้ไม่ถูกต้อง ในทำนองเดียวกันก็จะ เป็น Val เท่ากับเท่ากับ ไม่เสียใจที่ 5 และก็ยังจะเป็นเท็จเช่นกัน ดังนั้นมันจะบอกว่าไม่มี มันไม่เป็นความจริงเช่นกันดังนั้นจึงเป็นเรื่อง จะกลับมานี้สุดท้าย ดังนั้นนี้เป็นอย่างใดอย่างหนึ่งเป็นสิ่งที่ดีหรือไม่ดี สิ่งที่ขึ้นอยู่กับวิธีการที่คุณดู เพราะเมื่อคุณอยู่ การสร้างฟังก์ชั่นเหล่านี้ คุณไม่ได้รู้จริงสิ่งที่เกิดขึ้น ดังนั้นบางครั้งคุณต้องการข้อผิดพลาด หรือบางทีคุณอาจต้องการเพียงแค่การเตือน ในกรณีนี้ R ไม่ได้ทำอย่างนั้น ดังนั้นจึงเป็นจริงขึ้นอยู่กับ คุณตามออกของสิ่งที่ คุณคิดภาษา ควรจะทำอย่างไรในกรณีนี้ ถ้าคุณผ่านในเวกเตอร์ของ Booleans เมื่อคุณกำลังทำถ้าเงื่อนไข ดังนั้นขอบอกว่าคุณมีเดิม เป็นหนึ่งเดียวกับถ้าอื่นกลับ TRUE และคุณ จะกลับเท็จ ดังนั้นวิธีหนึ่งในการสรุป นี้คือการบอกว่าฉัน ไม่จำเป็นต้องมีสิ่งนี้มีเงื่อนไข สิ่งที่ฉันสามารถทำได้ก็คือเพียงแค่ กลับค่าของตัวเอง ดังนั้นถ้าคุณสังเกตเห็นถ้าคุณ Val ทำคือสูงกว่า 5, นี้จะกลับมา เวกเตอร์เท็จเท็จ TRUE อาจจะเป็นสิ่งที่คุณ ต้องการ bounded.compare คุณต้องการที่จะกลับเวกเตอร์ของ Booleans ที่จะเปรียบเทียบแต่ละค่า เพื่อตัวเอง ดังนั้นคุณก็สามารถทำ bounded.compare ฟังก์ชั่น x, เท่ากับ 5 และจากนั้นแทนการทำ นี้ถ้าเงื่อนไขอื่น ฉันแค่ไปที่จะกลับมา x มากกว่า 5 ดังนั้นถ้ามันเป็นความจริงแล้ว มันจะกลับ TRUE แล้วถ้ามันไม่ได้ก็ จะกลับเท็จ และนี่จะทำงานให้ ใด ๆ ของโครงสร้างเหล่านี้ ดังนั้นผมจึงสามารถ bounded.compare ค 1 6 หรือ 9 แล้วฉันจะบอกว่าเท่ากับ 6 เช่น และจากนั้นก็จะ ให้คุณบูลีนที่เหมาะสม เวกเตอร์ที่คุณกำลังออกแบบ ดังนั้นผู้ที่มีเพียงฟังก์ชั่น และตอนนี้ให้ฉันเพียงแค่ แสดงบางภาพแบบโต้ตอบ ฉันไม่คิดว่าที่จริงผมมี Wi-Fi ที่นี่เพื่อให้ฉันเพียงไปข้างหน้า และข้ามอันนี้ผมคิดว่า แต่สิ่งหนึ่งที่เย็น แต่คือว่าถ้าคุณเพียง ต้องการที่จะทดสอบพวงของ คำสั่งข้อมูลที่แตกต่าง มีพวงของชุดข้อมูลที่แตกต่างกัน ที่มีการโหลดไว้แล้วในอาร์ ดังนั้นหนึ่งในนั้นคือ เรียกว่าชุดข้อมูลที่ม่านตา นี้เป็นหนึ่งในที่สุดที่รู้จักกันดี คนในการเรียนรู้เครื่อง คุณจะมักจะทำเพียงแค่การจัดเรียงของบางอย่าง กรณีทดสอบเพื่อดูว่ารหัสของคุณทำงาน เพื่อให้เพียงตรวจสอบสิ่งที่ไอริส ดังนั้นสิ่งนี้เป็นไป ที่จะเป็นกรอบข้อมูล และมันเป็นชนิดของนานเพราะ ฉันเพียงแค่พิมพ์ออกมาม่านตา มันพิมพ์ออกสิ่งทั้งหมด ดังนั้นจึงมีทั้งหมดเหล่านี้ชื่อที่แตกต่างกัน ม่านตาเพื่อให้เป็นคอลเลกชัน ของดอกไม้ที่แตกต่างกัน ในกรณีนี้มันกำลังบอก คุณสายพันธุ์ของมัน ทุกความกว้างที่แตกต่างกันเหล่านี้และ ความยาวของกลีบเลี้ยงและกลีบดอก และอื่น ๆ ตามปกติถ้า คุณต้องการพิมพ์ม่านตา ตัวอย่างเช่นคุณไม่ต้องการที่จะมีมัน ทำทั้งหมดนี้เพราะเห็นว่าสามารถใช้เวลามากกว่า คอนโซลทั้งหมดของคุณ ดังนั้นสิ่งหนึ่งที่จริงๆ ที่ดีคือฟังก์ชั่นหัว ดังนั้นหากคุณเพียงแค่ทำหัว ม่านตานี้จะให้คุณ แรกห้าแถวหรือหกฉันเดา และแล้วดีคุณ เพียงแค่สามารถระบุที่นี่ ดังนั้น 20-- นี้จะให้ คุณแรก 20 แถว และที่จริงผมเป็นคนใจดี ประหลาดใจที่ว่านี้ ให้ผมหกเพื่อให้ฉันไปข้างหน้า และตรวจสอบ iris-- หรือหัวขอโทษ และนี่ก็จะให้ คุณเอกสาร ของสิ่งที่หัวมูลค่าไม่ ดังนั้นมันกลับมาเป็นครั้งแรก หรือสุดท้ายของวัตถุ และจากนั้นผมกำลังจะไป มองไปที่ค่าเริ่มต้น และจากนั้นก็กล่าวว่าเริ่มต้น หัววิธี x และ n เท่ากับ 6 ลิตร ดังนั้นผลตอบแทนที่แรกหกองค์ประกอบ และในทำนองเดียวกันถ้าคุณสังเกตเห็นที่นี่ผม ไม่ได้มีการระบุ n เท่ากับ 6 โดยค่าเริ่มต้นจะใช้หกฉันเดา แล้วถ้าผมต้องการที่จะระบุบางอย่าง มูลค่าแล้วฉันจะดูว่าเป็นอย่างดี เพื่อให้เป็นบางคำสั่งที่ง่ายและ นี่คือหนึ่งที่ just-- ดีอีก ฉัน can-- นี้เป็นจริง เล็ก ๆ น้อย ๆ ที่ซับซ้อนมากขึ้น แต่เรื่องนี้ก็จะใช้เวลาเรียน ของแต่ละคอลัมน์ของชุดข้อมูลที่ม่านตา ดังนั้นนี่จะแสดงสิ่งที่แต่ละเหล่านี้ คอลัมน์ในแง่ของประเภทของพวกเขา ดังนั้นความยาวกลีบเลี้ยงเป็นตัวเลข ความกว้างกลีบเลี้ยงเป็นตัวเลข ค่าทั้งหมดเหล่านี้เป็นเพียงตัวเลข เพราะคุณสามารถบอกได้จากข้อมูลนี้ โครงสร้างเหล่านี้เป็น ทุกคนจะต้องเป็นตัวเลข และคอลัมน์ชี่ เป็นไปได้ที่จะเป็นปัจจัย ดังนั้นตามปกติคุณจะคิดว่า นี้เป็นเหมือนสายอักขระ แต่ถ้าคุณแค่ทำ irisSpecies, แล้วฉันจะทำหัวที่ 5 และนี่คือที่จะพิมพ์ ออกห้าครั้งแรกค่า และแจ้งให้ทราบแล้วในระดับนี้ ดังนั้นนี้จะ saying-- นี้เป็นวิธีที่อาร์ ของการมีตัวแปรเด็ดขาด ดังนั้นแทนที่จะเพียง มีสตริงตัวอักษร มันมีระดับที่ระบุ ซึ่งสิ่งเหล่านี้เป็น ดังนั้นสมมติว่า irisSpecies 1 ดังนั้นสิ่งที่คุณต้องการที่จะทำนี่คือฉัน Subsetting คอลัมน์นี้สปีชีส์ ดังนั้นนี้จะใช้เวลา คอลัมน์สายพันธุ์แล้ว ดัชนีมันเพื่อให้ได้องค์ประกอบแรก ดังนั้นควรให้ setosa ต้น และมันยังช่วยให้ระดับคุณที่นี่ ดังนั้นคุณยังสามารถเปรียบเทียบ นี้เพื่อ setosa ต้นต​​ัวอักษร และนี่คือที่ไม่ได้ไป ที่จะเป็นจริงเพราะหนึ่ง เป็นชนิดที่แตกต่างกันกว่าที่อื่น ๆ หรือผมคิดว่ามันเป็นความจริงเพราะ R เป็นคนฉลาดมากขึ้นกว่าที่ และมันมีลักษณะที่นี้แล้ว กล่าวว่าอาจจะเป็นสิ่งที่คุณต้องการ ดังนั้นมันจะบอกว่าตัวละครตัวนี้ setosa ต้นสตริงเป็นเช่นเดียวกับคนนี้ และจากนั้นก็ทำนองเดียวกันคุณสามารถ ก็เป็นเพียงแค่คว้าเหล่านี้เช่นอื่น ๆ เพื่อให้เป็นเพียงแค่การจัดเรียงของบางอย่าง คำสั่งอย่างรวดเร็วของชุดข้อมูล ดังนั้นนี่คือการสำรวจข้อมูลบางอย่าง ดังนั้นนี่คือเล็ก ๆ น้อย ๆ ที่เกี่ยวข้องกับการวิเคราะห์ข้อมูล และสิ่งนี้จะนำมาจากบางส่วน Bootcamp ใน R สำหรับในเบิร์กลีย์ ห้องสมุดดังนั้นต่างประเทศ ดังนั้นผมจะโหลดใน ห้องสมุดที่เรียกว่าต่างประเทศ ดังนั้นนี้จะให้ฉัน read.dta ดังนั้นคิดว่าฉันมีชุดนี้ นี้ถูกเก็บไว้ในปัจจุบัน ไดเรกทอรีการทำงานของคอนโซลของฉัน เพื่อให้เพียงเห็นสิ่งที่ ไดเรกทอรีการทำงานเป็น ดังนั้นนี่คือไดเรกทอรีการทำงานของฉัน และอ่านข้อมูลจุดนี้ สิ่งที่จะบอกว่าไฟล์นี้ ตั้งอยู่ในโฟลเดอร์ข้อมูลของ นี้ไดเรกทอรีการทำงานปัจจุบัน และ read.dta นี้ไม่ได้ คำสั่งเริ่มต้น ผมคิดว่าผมโหลดไว้ในแล้ว IEI สันนิษฐานว่าผมโหลดนี้แล้ว แต่จนถึง read.dta ไม่ได้ไป จะเป็นคำสั่งเริ่มต้น และนั่นคือเหตุผลที่คุณกำลังจะมี การโหลดในห้องสมุดนี้ package-- แพคเกจนี้เรียกว่าต่างประเทศ และถ้าคุณไม่ได้มี แพคเกจที่ฉันคิดว่า ต่างประเทศเป็นหนึ่งในคนที่ในตัว มิฉะนั้นคุณยังสามารถ ทำ install.packages และจะติดตั้งแพคเกจ และนี่จะทำให้คุณอาร์เอ่อไม่มี และแล้วฉันแค่จะหยุด นี้เพราะผมมีมัน แต่สิ่งที่ดีจริงๆเกี่ยวกับการวิจัย คือการจัดการแพคเกจ ระบบนี้เป็นระบบที่สง่างามมาก เพราะมันจะเก็บทุกอย่าง จริงๆอย่างดีสำหรับคุณ ดังนั้นในกรณีนี้ก็จะจัดเก็บ ในผมเชื่อว่าห้องสมุดนี้ที่นี่ ดังนั้นตลอดเวลาที่คุณต้องการ ติดตั้งแพคเกจใหม่ มันเป็นเพียงแค่เป็นง่ายๆเป็น ทำ install.packages และ R จะจัดการทั้งหมด แพคเกจสำหรับคุณ ดังนั้นคุณจึงไม่ต้องทำอะไรบางอย่างใน งูหลามที่คุณมีแพคเกจภายนอก ผู้จัดการเช่นกระดาษ งูที่คุณ doing-- คุณติดตั้ง แพคเกจด้านนอกของงูหลาม และจากนั้นคุณพยายามที่จะเรียกพวกเขาเอง ดังนั้นนี้เป็นวิธีที่ดีจริงๆ และ install.packages ต้องใช้อินเทอร์เน็ต มันต้องใช้เวลาจากเซิร์ฟเวอร์ และพื้นที่เก็บข้อมูลที่ เก็บรวบรวมทั้งหมด แพคเกจที่เรียกว่า CRAN และคุณสามารถระบุว่าการจัดเรียงของกระจก คุณต้องการดาวน์โหลดแพคเกจจาก ดังนั้นที่นี่ฉันกินชุดนี้ ฉันอ่านมันในการใช้ฟังก์ชั่นนี้ เพื่อให้ฉันไปข้างหน้าและทำอย่างนั้น ดังนั้นสมมติว่า คุณมีชุดนี้ และคุณมีอย่างแน่นอน ความคิดที่ว่ามันคืออะไรไม่มี และนี่จริงขึ้นมา ค่อนข้างบ่อยในอุตสาหกรรม ที่คุณเพิ่งได้เหล่านี้ ตันและตันของสิ่งที่ยุ่ง และพวกเขากำลังที่ไม่มีป้ายกำกับอย่างไม่น่าเชื่อ ดังนั้นที่นี่ฉันมีนี้ ชุดและผมไม่ทราบว่า ว่ามันคืออะไรดังนั้นฉันเพียงแค่ แสดงเพื่อตรวจสอบออก ดังนั้นฉันจะทำหน้าแรก ดังนั้นผมจึงตรวจสอบครั้งแรกที่หก คอลัมน์ของสิ่งที่ชุดนี้ ดังนั้นนี่คือรัฐ pres04 แล้ว ทั้งหมดเหล่านี้การจัดเรียงที่แตกต่างกันของคอลัมน์ และสิ่งที่น่าสนใจ ที่นี่ผมคิดว่าคือการที่คุณ จะถือว่ามีลักษณะนี้ เช่นการจัดเรียงของการเลือกตั้งบางส่วน และผมคิดว่ามาจาก กำลังมองหาที่ไฟล์ ชื่อนี้เป็นประเภทของคอลเลกชันบาง ข้อมูลเกี่ยวกับผู้สมัครหรือผู้มีสิทธิเลือกตั้ง ที่ลงคะแนนให้ประธานาธิบดีที่เฉพาะเจาะจง หรือผู้สมัครประธานาธิบดี สำหรับการเลือกตั้ง 2004 ดังนั้นนี่คือค่าที่ 1, 2 ดังนั้นวิธีหนึ่งในการจัดเก็บ ผู้สมัครประธานาธิบดี เป็นชื่อของเขา ในกรณีนี้ดูเหมือนว่า พวกเขากำลังเพียงค่าจำนวนเต็ม ดังนั้นปี 2004 มันเป็นบุช เมื่อเทียบกับเคอร์รี่ผมเชื่อว่า และตอนนี้สมมติว่าคุณก็ไม่ทราบ ไม่ว่าจะเป็น 1 สอดคล้องกับบุชหรือ 2 สอดคล้องกับเคอร์รีและหรือ อื่น ๆ และอื่น ๆ ใช่มั้ย? และนี่คือเพียงแค่ให้ฉัน ปัญหาที่พบบ่อยอย่างเป็นธรรม ดังนั้นสิ่งที่คุณสามารถทำได้ในกรณีนี้หรือไม่? ดังนั้นขอให้ตรวจสอบทุกสิ่งอื่น ๆ เหล่านี้ รัฐฉันสมมตินี้ มาจากรัฐที่แตกต่าง partyid รายได้ ลองดูที่ partyid ดังนั้นบางทีสิ่งหนึ่งที่คุณสามารถทำได้คือ ดูแต่ละข้อสังเกต ที่มี partyid ของรีพับลิกัน หรือพรรคประชาธิปัตย์หรือบางสิ่งบางอย่าง เพื่อให้เพียงมองสิ่งที่เป็น partyid ดังนั้นฉันจะใช้เวลา ว่าแล้วฉันจะ ที่จะทำเครื่องหมายดอลลาร์นี้ ผู้ประกอบการที่ฉันไม่ก่อนหน้านี้ และนี้เป็นไป ย่อยคอลัมน์ว่า และจากนั้นผมจะมุ่งหน้านี้ 20 เพียงเพื่อดูสิ่งนี้ดูเหมือนว่า ดังนั้นนี้เป็นเพียงพวงของ NAS ดังนั้นในคำอื่น ๆ ที่คุณมี ข้อมูลที่หายไปเกี่ยวกับคนเหล่านี้ แต่คุณยังแจ้งให้ทราบนี้ partyid ว่าเป็นปัจจัย ดังนั้นนี้จะช่วยให้คุณประเภทที่แตกต่างกัน ดังนั้นในคำอื่น ๆ ที่สามารถใช้ partyid พรรคประชาธิปัตย์, พรรครีพับลิอิสระ หรือสิ่งอื่นใด ถ้าอย่างนั้นเราไปข้างหน้าและขอ ดูว่าของเหล่านี้เป็นเท่าไหร่โอ้ตกลง ดังนั้นฉันจะไปยังกลุ่มย่อย เพื่อ partyid แล้ว ดูว่าคนที่มี พรรคประชาธิปัตย์ยกตัวอย่างเช่น นี้จะทำให้คุณบูลีน บูลีนขนาดใหญ่ของ TRUEs และ falses และตอนนี้ขอบอกว่าฉันต้องการ กลุ่มคนเหล่านี้จะ ดังนั้นนี่จะใช้เวลาของฉันและว่า แล้วแต่จำนวนใดจะย่อยสังเกต มี partyid เท่ากับเท่ากับพรรคประชาธิปัตย์ และนี่คือค่อนข้างนานเพราะ มีจำนวนมากดังนั้นของพวกเขา ดังนั้นตอนนี้ผมกำลังจะมุ่งหน้านี้ในวันที่ 20 และในขณะที่คุณสังเกตเท่ากับเท่ากับ เป็นที่น่าสนใจในการที่คุณ already-- คุณยังรวมถึง NAS ดังนั้นในกรณีนี้คุณยังไม่สามารถรับ ข้อมูลใด ๆ เพราะตอนนี้คุณมี NAS และคุณก็ต้องการที่จะเห็นว่า สังเกตสอดคล้องกับพรรคประชาธิปัตย์ และไม่เหล่านี้หายไปค่าตัวเอง ดังนั้นวิธีที่คุณจะได้รับการกำจัด NAS เหล่านี้หรือไม่ ดังนั้นที่นี่ฉันแค่ใช้คีย์ขึ้นบนของฉัน เคอร์เซอร์แล้วบอกว่าย้ายไปรอบ ๆ และแล้วที่นี่ฉันแค่ไป ที่จะบอกว่า is.na datpartyid ดังนั้นนี้และและจะใช้เวลา สองเวกเตอร์บูลีนที่แตกต่างกัน และบอกว่ามันเป็นไปได้ จริงและเท็จเช่น ดังนั้นมันจะทำเช่นนี้องค์ประกอบที่ชาญฉลาด ดังนั้นที่นี่ฉันพูดใช้ กรอบข้อมูลย่อย กับคนที่สอดคล้องกับพรรคประชาธิปัตย์ และลบใด ๆ ของพวกเขาที่ไม่ได้ NA ดังนั้น will-- นี้ควร บางสิ่งบางอย่างให้คุณ ลองมาดูกัน is.na. ลอง is.na datpartyid และนี่ควรให้ you-- sorry-- เพียงเวกเตอร์บูลีน และจากนั้นก็เพราะมันนานมาก ฉันจะไปย่อยถึง 20 ตกลง ดังนั้นนี้ควรจะทำงาน และหนึ่งนี้ยังจะ TRUEs Ah ดังนั้นข้อผิดพลาดของฉันที่นี่คือที่ I'm-- ฉัน ใช้ภาษา C ++ และ R สลับกันดังนั้นผมจึงทำให้ ความผิดพลาดตลอดเวลานี้ และผู้ประกอบการคือ จริงหนึ่งที่คุณต้องการ คุณไม่ต้องการที่จะใช้สอง เครื่องหมายเพียงหนึ่งเดียว ตกลง ดังนั้นเรามาดู ดังนั้นเราจะ subsetted partyid ที่พวกเขากำลังประชาธิปัตย์ และพวกเขาไม่ได้หายไปค่า และตอนนี้ให้ดูที่ คนที่พวกเขาลงคะแนนให้ ดังนั้นดูเหมือนว่าต้องการมากที่สุด ของพวกเขาลงคะแนนให้ 1 ดังนั้นฉันจะไปข้างหน้า และบอกว่าเป็นเคอร์รี และในทำนองเดียวกันคุณสามารถ ยังไปรีพับลิกัน และหวังว่านี้จะช่วยให้คุณ 2 มันเป็นเพียงพวงของคอลัมน์ที่แตกต่างกัน และแน่นอนมันคือ 2 ดังนั้น partyid รีพับลิกันทั้งหมด ส่วนใหญ่ของพวกเขาจะลงคะแนนเสียงสำหรับ 2 ดังนั้นจึงดูเหมือนว่าเพียง โดยดูที่นี้ รีพับลิกันที่เป็นไปได้ very-- หรือ partyid เป็นไปได้มาก ปัจจัยใหญ่ในการกำหนด ซึ่งผู้สมัครที่พวกเขากำลัง จะไปลงคะแนนให้ และนี่คือความจริงที่เห็นได้ชัดในทั่วไป และนี้ตรงกับของคุณ สัญชาตญาณของหลักสูตร ดังนั้นจึงดูเหมือนว่าฉัน วิ่งออกมาจากเวลาเพื่อ ให้ฉันก็ควรจะไปข้างหน้า และแสดงภาพบางส่วนได้อย่างรวดเร็ว ดังนั้นนี่คือสิ่งที่เล็กน้อย ที่มีความซับซ้อนมากยิ่งขึ้นด้วยการสร้างภาพ ดังนั้นในกรณีนี้เป็นอย่างมาก การวิเคราะห์ง่ายเพียงแค่การตรวจสอบสิ่งที่ ประธาน '04 เป็น ดังนั้นในกรณีนี้สมมติว่าคุณ ต้องการที่จะตอบคำถามนี้ ดังนั้นสมมติว่าเราอยากจะรู้ว่าการออกเสียงลงคะแนน พฤติกรรมในการเลือกตั้งประธานาธิบดี 2004 และวิธีการที่แตกต่างกันไปโดยการแข่งขัน ดังนั้นไม่เพียง แต่ที่คุณต้องการ เห็นพฤติกรรมการลงคะแนนได้ แต่คุณต้องการไปยังกลุ่มย่อยของแต่ละ การแข่งขันและการเรียงลำดับของการสรุปว่า และคุณสามารถบอกได้ โดยสัญกรณ์ที่ซับซ้อนนี้ ว่าเรื่องนี้เป็นชนิดของการหมอก ดังนั้นหนึ่งในที่สูงขึ้น R แพคเกจที่นี้ยังเป็นชนิดของที่ผ่านมา เรียกว่า dplyr ดังนั้นจึงเป็นสิ่งหนึ่งที่เหมาะสมที่นี่ และ ggg-- ggplot2 เป็นเพียงความสุข วิธีการทำการสร้างภาพที่ดีขึ้น กว่าในตัวหนึ่ง ดังนั้นผมจะโหลด ทั้งสองห้องสมุด แล้วฉันจะไป ข้างหน้าและใช้คำสั่งนี้ คุณก็สามารถรักษานี้เป็นกล่องสีดำ สิ่งที่เกิดขึ้นก็คือว่าท่อนี้ ผู้ประกอบการจะผ่านในเรื่องนี้ เข้าที่นี่ ดังนั้นฉันพูดโดยกลุ่มว่า การแข่งขันและจากนั้นประธาน 04 และแล้วทุกคำสั่งอื่น ๆ เหล่านี้ จะถูกกรองแล้วสรุป ที่ฉันทำและนับ แล้วผมวางแผนได้ที่นี่ เย็นตกลง ถ้าอย่างนั้นเราไปข้างหน้าและ เห็นสิ่งนี้ดูเหมือนว่า ดังนั้นสิ่งที่เกิดขึ้นที่นี่คือผมว่า เพียงแค่พล็อตของแต่ละการแข่งขันแล้ว คนที่พวกเขาลงคะแนนให้ และทั้งสองแตกต่างกัน ค่าสอดคล้องกับที่ 2 และ 1 ถ้าคุณต้องการที่จะมีมากขึ้น สง่างามนอกจากนี้คุณยังสามารถ เพียงแค่ระบุที่ 2 เป็น Kerry-- หรือ 2 เป็นบุชแล้ว 1 เป็นเคอร์รี และคุณยังสามารถมี ว่าในตำนานของคุณ และคุณยังสามารถแยกกราฟแท่งเ​​หล่านี้ เพราะสิ่งหนึ่งที่เป็น ว่าถ้าคุณสังเกตเห็น นี้ไม่ใช่เรื่องง่ายมากที่จะระบุ ซึ่งทั้งสองค่ามีขนาดใหญ่ ดังนั้นสิ่งหนึ่งที่คุณต้องการ ทำคือการใช้พื้นที่สีฟ้านี้ และเพิ่งย้ายไปที่นี่เพื่อให้คุณ สามารถเปรียบเทียบทั้งสองด้านโดยด้านข้าง และผมคิดว่านั่นคือสิ่งที่ฉัน ไม่ได้มีเวลาที่จะทำในขณะนี้ แต่ที่ยังเป็นเรื่องง่ายมากที่จะทำ คุณก็สามารถมองเข้าไปใน หน้าคนของ ggplot ดังนั้นคุณก็สามารถทำเช่น ggplot และอ่านในหน้าคนนี้ ดังนั้นให้ฉันเพียงแค่ได้อย่างรวดเร็ว แสดงบางสิ่งบางอย่างเย็น ลองไปข้างหน้าและไป to-- เพียง การประยุกต์ใช้การเรียนรู้เครื่อง ดังนั้นสมมติว่าเรามีสามเหล่านี้ แพคเกจเพื่อผมจะโหลดเหล่านี้ใน ดังนั้นเพียงแค่นี้พิมพ์ออกบางส่วน ข้อมูลหลังจากที่ผมโหลดในสิ่งที่ ดังนั้นฉันพูด read.csv นี้ ชุดนี้และตอนนี้ ฉันจะไปข้างหน้าและมองและ เห็นสิ่งที่อยู่ภายในชุดนี้ ดังนั้นก่อนที่ 20 สังเกต ดังนั้นผมก็ต้อง X1, X2 และวายดังนั้นจึง ดูเหมือนว่าพวงของค่าเหล่านี้ มีตั้งแต่บางที 20-80 หรือมากกว่านั้น และแล้วในทำนองเดียวกันสำหรับ X2 แล้ว Y นี้น่าจะเป็นป้าย 0 และ 1 เมื่อต้องการตรวจสอบนี้ผมสามารถ เพียงแค่ทำสรุปข้อมูล X1 และแล้วในทำนองเดียวกันสำหรับ คอลัมน์อื่น ๆ เหล่านี้ ดังนั้นสรุปเป็นวิธีที่รวดเร็วของ เพียงแค่คุณแสดงค่าอย่างรวดเร็ว โอ้ขอโทษ หนึ่งนี้ควรจะวาย ดังนั้นในกรณีนี้ให้ quantiles, มีเดีย, maxes ได้เป็นอย่างดี ในกรณีนี้ DataY คุณสามารถดู ว่ามันเป็นเพียงแค่จะเป็น 0 และ 1 นอกจากนี้ยังหมายถึงไม่ว่าจะเป็น 0.6 เพียงหมายความว่ามัน ดูเหมือนว่าฉันมี 1s มากกว่า 0s เพื่อให้ฉันไปข้างหน้าและการแสดง คุณได้สิ่งนี้ดูเหมือนว่า ดังนั้นฉันแค่จะไปพล็อตนี้ ลองมาดูวิธีการล้างนี้ โอ้ตกลง ตกลง ดังนั้นนี่คือสิ่งที่ดูเหมือนว่า ดังนั้นจึงดูเหมือนว่าสีเหลืองผมระบุ เป็น 0 แล้วผมสีแดงระบุเป็น 1s ดังนั้นที่นี่ดูเหมือนว่า จุดฉลากและมัน ดูเหมือนว่าคุณแค่อยากบาง การเรียงลำดับของการจัดกลุ่มเกี่ยวกับเรื่องนี้ และแจ้งให้เราเพียงไปข้างหน้าและการแสดง บางส่วนของฟังก์ชั่นในตัวเหล่านี้ ดังนั้นนี่คือ LM ดังนั้นนี่เป็นเพียงการพยายาม เพื่อให้พอดีกับเส้นนี้ ดังนั้นสิ่งที่เป็นวิธีที่ดีที่สุด ที่ฉันสามารถใส่สายดังกล่าว ว่ามันที่ดีที่สุดที่จะแยก การเรียงลำดับของการจัดกลุ่มนี้ และความนึกคิดคุณก็สามารถมองเห็น ที่ฉันเพิ่งเรียกใช้คำสั่งเหล่านี้ทั้งหมด แล้วฉันจะ ข้างหน้าและเพิ่มบรรทัด ดังนั้นนี้ดูเหมือนว่าเดาที่ดีที่สุด ก็สละที่ดีที่สุดที่จะช่วยลด ข้อผิดพลาดในการพยายามให้พอดีกับสายนี้ เห็นได้ชัดว่านี้มีลักษณะชนิดของ ดี แต่มันไม่ได้เป็นสิ่งที่ดีที่สุด และรูปแบบเชิงเส้นใน โดยทั่วไปเป็นไปได้ จริงที่ดีสำหรับทฤษฎีและการจัดเรียงเพียง พื้นฐานอาคารของเครื่อง การเรียนรู้ แต่ในทางปฏิบัติคุณกำลังจะไป ต้องการที่จะทำบางสิ่งบางอย่างมากขึ้นทั่วไป ดังนั้นคุณก็สามารถลองใช้ สิ่งที่เรียกว่าเครือข่ายประสาท สิ่งเหล่านี้เป็น มากขึ้นร่วมกันมากขึ้น และพวกเขาก็ทำงานน่าขนลุก สำหรับชุดข้อมูลขนาดใหญ่ ดังนั้นในกรณีนี้เราเท่านั้น have-- ขอดูหน่อยเรามี nRow ดังนั้น nRow เป็นเพียงการบอกจำนวนของแถว ดังนั้นในกรณีนี้ผม มี 100 ข้อสังเกต เพื่อให้ฉันไปข้างหน้าและ ทำให้โครงข่ายประสาทเทียม ดังนั้นนี่เป็นสิ่งที่ดีจริงๆ เพราะผมก็สามารถพูด nnet แล้วผมถอยวาย ดังนั้น Y เป็นคอลัมน์นั้น และจากนั้นก็ถอยมันใน อีกสองตัวแปร ดังนั้นนี่คือสั้น สัญกรณ์สำหรับ X1 และ X2 ถ้าอย่างนั้นเราไปข้างหน้าและทำงานนี้ โอ้ขอโทษ ฉันต้องการที่จะทำงานนี้สิ่งที่ทั้ง และนี่เป็นเพียงสัญกรณ์พิมพ์ สำหรับวิธีการได้อย่างรวดเร็วหรือไม่ได้อย่างรวดเร็ว แปรสภาพ ดังนั้นดูเหมือนว่ามันไม่มาบรรจบกัน เพื่อให้ฉันไปข้างหน้าและการพิมพ์ สิ่งนี้ดูเหมือนว่า ดูที่นี่คือภาพและที่นี่เป็น รูปร่างแสดงวิธีการที่ดีมันพอดี และนี่คือ just-- คุณสามารถดู นี้ว่าเป็นมากดีมาก มันก็อาจจะเป็น overfitting แต่คุณยังสามารถ บัญชีนี้กับคนอื่น ๆ เทคนิคเช่นการตรวจสอบข้าม และสิ่งเหล่านี้ถูกสร้างขึ้นยังเป็นอาร์ และแจ้งให้เราเพียงแค่แสดง สนับสนุนเครื่องเวกเตอร์ นี้เป็นอีกหนึ่งที่พบบ่อยจริงๆ เทคนิคในการเรียนรู้เครื่อง มันจะคล้ายกับรูปแบบเชิงเส้น แต่ จะใช้สิ่งที่เรียกว่าวิธีการเคอร์เนล และขอดูวิธีการที่ดีที่ไม่ ดังนั้นหนึ่งนี้จะคล้ายกับวิธีการ ทั้งเครือข่ายประสาทดำเนินการ, แต่ก็เรียบเนียนมากขึ้น และนี่จะตามออก ของ what-- วิธีการทำงานจำแนก ดังนั้นนี่เป็นเพียงมาก ภาพรวมอย่างรวดเร็วของบาง ฟังก์ชั่นในตัวที่คุณสามารถทำได้ และยังมีบางส่วนของการสำรวจข้อมูล เพื่อให้ฉันเพียงไปข้างหน้า และกลับไปที่ภาพนิ่ง ดังนั้นเห็นได้ชัดนี้เป็น ไม่ได้ครอบคลุมมาก และนี่คือจริงๆเพียงแค่ทีเซอร์ แสดงให้คุณเห็นสิ่งที่คุณสามารถทำได้ในอาร์ ดังนั้นหากคุณต้องการเพียงแค่ เพื่อเรียนรู้เพิ่มเติมที่นี่ มีพวงของทรัพยากรที่แตกต่างกัน ดังนั้นหากคุณรักตำราหรือคุณ เพียงแค่รักการอ่านสิ่งที่ออนไลน์ แล้วนี้เป็นที่ยอดเยี่ยม หนึ่งโดยแฮดเลย์วิคแฮม ที่ยังสร้างทั้งหมดเหล่านี้ แพคเกจที่เจ๋งจริงๆ หากคุณรักวิดีโอแล้ว เบิร์กลีย์มี Bootcamp ที่น่ากลัว ที่ several-- ว่าเป็นชนิดของนาน และมันก็จะสอนให้คุณเกือบ ทุกสิ่งที่คุณต้องการรู้เกี่ยวกับอาร์ และในทำนองเดียวกันมี Codeacademy และสิ่งเหล่านี้จัดเรียงอื่น ๆ ของเว็บไซต์โต้ตอบ พวกเขายังได้รับ common-- มากขึ้นและบ่อยมากขึ้น ดังนั้นนี่จะคล้ายกับ Codeacademy และสุดท้ายถ้าคุณเพียง ชุมชนและต้องการความช่วยเหลือ เหล่านี้เป็นพวงของ สิ่งที่คุณสามารถไปที่ เห็นได้ชัดว่าเรายังคง ใช้รายชื่อผู้รับจดหมายเพียง ชอบเกือบทุกอื่น ๆ ชุมชนการเขียนโปรแกรมภาษา และ #rstats นี้เป็น ชุมชนของเราทวิตเตอร์ ที่จริงค่อนข้างบ่อย และจากนั้นผู้ใช้! เป็นเพียงการประชุมของเรา และแล้วแน่นอนคุณสามารถ ใช้ Q อื่น ๆ เหล่านี้และสิ่งที่, เหมือนกองมากเกิน, Google แล้ว GitHub เพราะส่วนใหญ่ของแพคเกจเหล่านี้ และจำนวนมากของชุมชน จะเป็นศูนย์กลางการพัฒนารอบ รหัสเพราะมันเป็นโอเพนซอร์ส และมันก็เป็นเพียงแค่ความสุขจริงๆใน GitHub และสุดท้ายคุณสามารถติดต่อฉันหาก เพียงแค่คุณมีคำถามใด ๆ ได้อย่างรวดเร็ว ดังนั้นคุณจึงสามารถหาฉันบนทวิตเตอร์ที่นี่ เว็บไซต์ของฉันและเพียงแค่อีเมลของฉัน ดังนั้นหวังว่านั่นคือ บางสิ่งบางอย่างเพียงแค่ทีเซอร์สั้น ของสิ่งที่ R มันมีความสามารถในการทำ และหวังว่าคุณเพียงแค่ ตรวจสอบเหล่านี้สามลิงค์ และดูว่าคุณสามารถทำขึ้น และผมคิดว่านั่นเป็นเพียงเกี่ยวกับเรื่องนี้ ขอบคุณ [APPLAUSE]