1 00:00:00,000 --> 00:00:03,234 >> [Мусиц плаиинг] 2 00:00:03,234 --> 00:00:05,275 3 00:00:05,275 --> 00:00:06,400 Роберт КРАБЕК: Здраво, момци. 4 00:00:06,400 --> 00:00:09,980 Моје име је Роберт Крабек, и Ја ћу да вам учење момци 5 00:00:09,980 --> 00:00:15,470 Како очистити веб са Нокогири, што је Руби библиотека, 6 00:00:15,470 --> 00:00:17,566 и кимоно, који је за Цхроме. 7 00:00:17,566 --> 00:00:20,940 8 00:00:20,940 --> 00:00:25,010 >> Дакле, прво постоји Неколико ствари вас да 9 00:00:25,010 --> 00:00:28,790 може да уради ако би сте били ради све псетс до сада 10 00:00:28,790 --> 00:00:31,170 и ваш радни простор је постаје мало пуна. 11 00:00:31,170 --> 00:00:37,060 Ми смо заправо могу само да одем и креирате нови радни простор за вас 12 00:00:37,060 --> 00:00:41,220 да само уради потпуно нови пројекат у. 13 00:00:41,220 --> 00:00:46,160 Дакле, ако желите да наставите ради у ИД ЦС50 шаблона 14 00:00:46,160 --> 00:00:49,080 да ли тренутно имате, слободно, а ви једноставно не могу 15 00:00:49,080 --> 00:00:54,700 инсталл нокогири са ЦФЛАГС екуалс-- драгуљ инсталл нокогири. 16 00:00:54,700 --> 00:00:56,930 Али иначе ћу ти показати како поставити нови једну. 17 00:00:56,930 --> 00:01:01,210 И онда је ово у суштини пада више тренинга точкова. 18 00:01:01,210 --> 00:01:07,120 А ти кодирање као да сте само кодирање у узвишене или тако нешто. 19 00:01:07,120 --> 00:01:12,365 Дакле, ако смо га пребаци преко. 20 00:01:12,365 --> 00:01:14,930 21 00:01:14,930 --> 00:01:18,690 >> Тако да је ово ваш тренутни ЦС 50 ИД. 22 00:01:18,690 --> 00:01:21,490 Само да одете на цлоуд9 овде. 23 00:01:21,490 --> 00:01:22,725 Можете да одете на ваш табли. 24 00:01:22,725 --> 00:01:26,720 25 00:01:26,720 --> 00:01:29,950 То би требало да доведе до таб радне површине. 26 00:01:29,950 --> 00:01:32,980 А онда можете да кликнете Овде, направите нови радни простор. 27 00:01:32,980 --> 00:01:37,600 Име свој нови радни простор, Можда тест, или стругање. 28 00:01:37,600 --> 00:01:42,700 И онда кликните овај обичај картицу овде, уместо картици ЦС50 темплатес. 29 00:01:42,700 --> 00:01:45,155 А онда можеш да идеш и створити нови простор за рад. 30 00:01:45,155 --> 00:01:48,280 >> Већ сам створио простор за рад овде. 31 00:01:48,280 --> 00:01:50,640 Дакле, ми ћемо радити са овим. 32 00:01:50,640 --> 00:01:55,380 А ако сте креирали нови радни простор тако да са Цустом таб, 33 00:01:55,380 --> 00:02:04,560 само да укуцате драгуљ инсталирати нокогири, која се не иде овде. 34 00:02:04,560 --> 00:02:06,230 У реду, то је мало замрзнути. 35 00:02:06,230 --> 00:02:08,979 Али можете уписати драгуљ инсталирати нокогири. 36 00:02:08,979 --> 00:02:15,970 И то би требало да буде све што постоји на инсталације. 37 00:02:15,970 --> 00:02:20,590 >> Као што сам рекао раније, ако си и даље ради у вашем ЦС50 шаблона ИД, 38 00:02:20,590 --> 00:02:30,270 само треба да укуцате ЦФЛАГС једнако драгуљ инсталл нокогири. 39 00:02:30,270 --> 00:02:33,130 И већ инсталиран овде тако да нећу то да урадим. 40 00:02:33,130 --> 00:02:38,500 Али за оне који прате заједно, слободно то урадите. 41 00:02:38,500 --> 00:02:46,000 >> Дакле, кад имаш ваш нокогири радни простор или библиотеке инсталиран, 42 00:02:46,000 --> 00:02:49,500 Ја ћу вам дати мало о убрзаном курсу у Руби синтакси 43 00:02:49,500 --> 00:02:53,380 јер нокогири је Руби библиотека. 44 00:02:53,380 --> 00:03:03,710 Дакле, морате да знате неке основне Руби Синтакса за рад са нокогири. 45 00:03:03,710 --> 00:03:08,750 Тако да неке основне разлике од онога што сте навикли 46 00:03:08,750 --> 00:03:13,370 Можда, ако сте радили до сада у само Ц и ПХП, 47 00:03:13,370 --> 00:03:16,010 ви прогласи променљиве без типа. 48 00:03:16,010 --> 00:03:19,720 Не користите зарез, који је нека врста олакшања. 49 00:03:19,720 --> 00:03:25,480 Нема заграде сада око за или док се петљи, на пример. 50 00:03:25,480 --> 00:03:29,460 Потребно је само да блок кода, и онда сте ставили крај на крају тога. 51 00:03:29,460 --> 00:03:32,380 Нема плус плус или минус минус, па само 52 00:03:32,380 --> 00:03:36,180 знају да када радиш за петље, 53 00:03:36,180 --> 00:03:38,620 само плус и минус једнаки једнаки. 54 00:03:38,620 --> 00:03:43,310 И уместо хасх укључују, ћете користити потребна и онда 55 00:03:43,310 --> 00:03:47,755 без обзира библиотека покушава за учитавање у свој програм. 56 00:03:47,755 --> 00:03:51,610 57 00:03:51,610 --> 00:03:53,430 >> Руби није саставио језика. 58 00:03:53,430 --> 00:03:55,550 Дакле, то је друга олакшање. 59 00:03:55,550 --> 00:03:59,350 То је више сличан ПХП где то је тумачи језик. 60 00:03:59,350 --> 00:04:03,570 Можете покренути било коју скрипту која Руби пишеш са рубином затим 61 00:04:03,570 --> 00:04:07,380 по имену вашег скрипте или програма. 62 00:04:07,380 --> 00:04:13,000 Да значи да је то Руби програма, само га завршити са .рб уместо .ц. 63 00:04:13,000 --> 00:04:17,440 А ту су и променљиви величине низови у Руби, 64 00:04:17,440 --> 00:04:23,200 што је супер згодно када сте стругање и можда желите да додате 65 00:04:23,200 --> 00:04:26,090 подаци које сте сцрапед у матрици. 66 00:04:26,090 --> 00:04:31,960 Не морате да маллоц нови низ и цопи стару низ у нови низ. 67 00:04:31,960 --> 00:04:36,150 Можете само додати са два арров знаци. 68 00:04:36,150 --> 00:04:39,820 И нема знакова, нема само сингле леттер жице. 69 00:04:39,820 --> 00:04:44,760 Тако да би требало да буде мало лакше. 70 00:04:44,760 --> 00:04:50,130 >> Дакле, ми ћемо вам дати неке примери неких основних Руби синтаксе. 71 00:04:50,130 --> 00:04:57,100 Дакле, овде можете видети да уместо косе црте Сласх, да коментарише у Руби, 72 00:04:57,100 --> 00:04:58,740 користите само знак за фунту. 73 00:04:58,740 --> 00:05:04,990 И променљива декларација, ви довољно је да унесете променљиве једнаки 74 00:05:04,990 --> 00:05:07,971 год желите да буде променљива. 75 00:05:07,971 --> 00:05:09,220 Они могу бити низови. 76 00:05:09,220 --> 00:05:14,120 Можете имати низ, који сте попунити са вредностима. 77 00:05:14,120 --> 00:05:17,240 ставља и отисци су слични. 78 00:05:17,240 --> 00:05:20,110 За наше потребе, Једина разлика је заиста 79 00:05:20,110 --> 00:05:25,500 да каже, што значи каже, само ставља нову линију 80 00:05:25,500 --> 00:05:27,440 карактер у свему што штампате. 81 00:05:27,440 --> 00:05:30,980 >> Дакле, ако дајемо мали демонстрације овде, 82 00:05:30,980 --> 00:05:41,800 можемо покренути ово са-- отворите нови терминал. 83 00:05:41,800 --> 00:05:46,020 Можете видети све ово датотеке које су у мом терминала. 84 00:05:46,020 --> 00:05:50,960 И ако само трчи Руби, Руби интро.рб га, 85 00:05:50,960 --> 00:05:53,530 гаси пет Поздрав Матхер, Куинци, превозник. 86 00:05:53,530 --> 00:05:54,410 Адамс. 87 00:05:54,410 --> 00:05:59,295 Тако да је све да декларисање низова. 88 00:05:59,295 --> 00:06:01,670 ПУБЛИКА Роберт, можеш ли Ваш фонта мало већи? 89 00:06:01,670 --> 00:06:02,461 Роберт КРАБЕК: Да. 90 00:06:02,461 --> 00:06:05,370 91 00:06:05,370 --> 00:06:12,280 И могу зумирати у, јер не можете приближили терминала фонтова очигледно. 92 00:06:12,280 --> 00:06:18,790 93 00:06:18,790 --> 00:06:24,630 >> Дакле, тако да одштампате варијабле то иоур терминала. 94 00:06:24,630 --> 00:06:28,820 Такође можете да користите варијабле унутар низа. 95 00:06:28,820 --> 00:06:33,720 Тако је недавно у ПХП, можда су научили 96 00:06:33,720 --> 00:06:37,340 да постоји низ интерполација. 97 00:06:37,340 --> 00:06:43,830 Дакле, ако погледате овде, ако И прогласити три променљиве, име, библиотеку, 98 00:06:43,830 --> 00:06:49,700 и језику и каже, ја напише низ, хелло ми наме ис. 99 00:06:49,700 --> 00:06:54,190 А онда уместо ПХП верзија стринг интерполације 100 00:06:54,190 --> 00:06:58,960 који изгледа мало више овако, имате знак фунти, а затим 101 00:06:58,960 --> 00:07:01,220 коврџава заграда, а затим име променљиве. 102 00:07:01,220 --> 00:07:07,350 И тако ћеш одштампате, кажу, без обзира на назив променљиве је. 103 00:07:07,350 --> 00:07:10,140 >> И тада можете спојите жице. 104 00:07:10,140 --> 00:07:12,890 Руби чини супер Полако са знаком плус. 105 00:07:12,890 --> 00:07:16,110 Потребно је само да један стринг лево плус променљивој 106 00:07:16,110 --> 00:07:18,860 или други низ плус низ. 107 00:07:18,860 --> 00:07:23,500 Дакле, ако сам одштампате ово, што би требало јуст саи Здраво, моје име је Роберт. 108 00:07:23,500 --> 00:07:27,340 Ја ћу се учим да нокогири у Руби. 109 00:07:27,340 --> 00:07:35,370 >> И хајде да потврдим да је то је заиста цасе-- рубин увод. 110 00:07:35,370 --> 00:07:36,480 Здраво, моје име је Роберт. 111 00:07:36,480 --> 00:07:40,160 Ја ћу се учим да нокогири у Руби. 112 00:07:40,160 --> 00:07:45,600 >> Мовинг он, иф елсе изјава, то је мало другачије 113 00:07:45,600 --> 00:07:49,800 од онога што би се могло користити за ако сте радили у Ц. 114 00:07:49,800 --> 00:07:53,200 Не треба заграде. 115 00:07:53,200 --> 00:07:55,220 Не требају витичасте. 116 00:07:55,220 --> 00:08:00,170 И уместо иф, то је спојени ЕЛСИФ. 117 00:08:00,170 --> 00:08:07,260 Дакле овде, ако сам прогласио к до Овде, као што видимо, к је и даље 5. 118 00:08:07,260 --> 00:08:11,100 Дакле, ако је к мање од 3, то ће ставити мали. 119 00:08:11,100 --> 00:08:14,030 Ако је мање од 7, средње, друго велико. 120 00:08:14,030 --> 00:08:17,340 Тако 5 је средње број. 121 00:08:17,340 --> 00:08:22,270 И завршити овај блок кода на крај. 122 00:08:22,270 --> 00:08:24,920 >> Овде је мој за петљу. 123 00:08:24,920 --> 00:08:28,240 И то је такође синтакса мало другачије. 124 00:08:28,240 --> 00:08:33,500 Од 0 до пет само суштински је проглашење низове од 0 до 5. 125 00:08:33,500 --> 00:08:36,120 Дакле, постоји пет слотова у низу. 126 00:08:36,120 --> 00:08:40,500 А онда за сваку слот у који низ, ја ћу бити инцрементинг и. 127 00:08:40,500 --> 00:08:46,080 Дакле, ово би требало да одштампате 0 до 5, или 0 до 4. 128 00:08:46,080 --> 00:08:49,630 И ово би требало да одштампате медиј. 129 00:08:49,630 --> 00:08:51,370 >> И ја ћу блазе кроз. 130 00:08:51,370 --> 00:08:54,466 Момци ће имати приступ том коду касније. 131 00:08:54,466 --> 00:08:55,965 Дакле, ви можете да покренете ову себе. 132 00:08:55,965 --> 00:09:02,090 133 00:09:02,090 --> 00:09:06,620 >> Дакле, ово је ваш основни док петља. 134 00:09:06,620 --> 00:09:12,230 Ово ће само бити штампање ј, инцрементинг од 1 до 5 ударимо. 135 00:09:12,230 --> 00:09:18,320 >> Супер брзо Руби убрзани курс како да напише функцију. 136 00:09:18,320 --> 00:09:24,460 Уместо, рецимо, Инт факторијални број, имамо само Деф. 137 00:09:24,460 --> 00:09:28,450 И у суштини сте дефинисање функција овде. 138 00:09:28,450 --> 00:09:30,600 Ово ће бити назив функције, 139 00:09:30,600 --> 00:09:34,280 и то је било који варијабле да Желим да пређе у функцији. 140 00:09:34,280 --> 00:09:36,760 Можете имати ако изјаве у. 141 00:09:36,760 --> 00:09:38,030 Можете се вратити. 142 00:09:38,030 --> 00:09:42,620 У овом случају, ми смо Дефинисање рекурсивно 143 00:09:42,620 --> 00:09:45,000 спроводи факторијел функција. 144 00:09:45,000 --> 00:09:48,660 Тако смо само зови функције у Руби овако. 145 00:09:48,660 --> 00:09:54,700 >> Дакле, ако сам дефинише ово, могу позвати факторијел, пролазе у 3, 146 00:09:54,700 --> 00:09:59,700 а затим са 3 ће бити број променљива да могу користити у функцији. 147 00:09:59,700 --> 00:10:08,010 И ово то_с је само окретањем вратити вредност факторијелском у стринг. 148 00:10:08,010 --> 00:10:10,760 У супротном то ће бацити грешка рекавши ох, 149 00:10:10,760 --> 00:10:13,230 Не може штампати стринг-- јер као што се сећате, 150 00:10:13,230 --> 00:10:18,230 ставља се стави стринг-- јер ово факторијални се вратио велики број. 151 00:10:18,230 --> 00:10:21,850 Дакле, можемо претворити да у низу слично. 152 00:10:21,850 --> 00:10:27,856 И обрнуто, можете претворити стринг на цео број са то_и. 153 00:10:27,856 --> 00:10:32,650 >> Дакле, што је све супер једноставна, ако само коментарисати ово, осим 154 00:10:32,650 --> 00:10:36,250 и покрените Факториал функцију. 155 00:10:36,250 --> 00:10:39,850 Требало би бити у стању да види да факторијални 3 је 6. 156 00:10:39,850 --> 00:10:42,790 И то је заиста истина. 157 00:10:42,790 --> 00:10:46,160 >> Дакле, то је ваш убрзани курс у Руби. 158 00:10:46,160 --> 00:10:53,550 А сада да знате Руби, можемо да идемо даље на основну нокогири стругање формацију. 159 00:10:53,550 --> 00:10:58,190 У суштини све што треба да урадите је, у Руби, потребно библиотеке. 160 00:10:58,190 --> 00:11:04,390 И за наше потребе бићемо користећи либрари ОпенУРИ као и нокогири. 161 00:11:04,390 --> 00:11:07,870 И онда шта Па-- и то ће да вам синтаксу на овоме-- 162 00:11:07,870 --> 00:11:16,010 је ли отворити много УРЛ као што би у увијени захтев, што је скраћеница за Ц УРЛ. 163 00:11:16,010 --> 00:11:20,330 >> Узмеш УРЛ веб сајт у питању. 164 00:11:20,330 --> 00:11:22,030 Ви га чувате у променљивој. 165 00:11:22,030 --> 00:11:27,400 А онда можете да претражујете кроз то варијабла за јединственим ХТМЛ тагова користећи 166 00:11:27,400 --> 00:11:30,590 .ЦСС команду. 167 00:11:30,590 --> 00:11:34,360 И онда даје излаз Садржај где год желите. 168 00:11:34,360 --> 00:11:35,720 Можете почети у бази података. 169 00:11:35,720 --> 00:11:42,040 Можете излаз у датотеци, или чак и само штампање на екран. 170 00:11:42,040 --> 00:11:47,290 >> Дакле, ми ћемо вам показати основне лопатице. 171 00:11:47,290 --> 00:11:52,570 Дакле, овде можете видети да имамо захтева нокогири, захтевају отвореног Ури. 172 00:11:52,570 --> 00:11:57,150 Ваш основни сет уп, хајде да позовите га документ или доктор, 173 00:11:57,150 --> 00:12:07,780 једнако нокогири :: ХТМЛ-отворено, што је команда под условом да нам је ОпенУРИ 174 00:12:07,780 --> 00:12:08,920 библиотека. 175 00:12:08,920 --> 00:12:14,000 И ми ћемо бити у потрази за оне ви који можда живе у куад, 176 00:12:14,000 --> 00:12:21,270 за одлагање бицикала које су наведене у Бостону он бике одељку Бостон Цраигслист 177 00:12:21,270 --> 00:12:22,020 сајт. 178 00:12:22,020 --> 00:12:26,460 >> Дакле, ако нисте упознати с цурл, ја ћу 179 00:12:26,460 --> 00:12:28,930 показати вам врло брзо шта ће урадити цУРЛ. 180 00:12:28,930 --> 00:12:38,350 Да сам хтео да се све УРЛ адресе из Тхе Цраигслист сајт, ако куцам Цурл, 181 00:12:38,350 --> 00:12:44,950 само баца све УРЛ адресе са бицикла сајту Цраигслист 182 00:12:44,950 --> 00:12:46,720 на мој терминала. 183 00:12:46,720 --> 00:12:49,130 То није нарочито корисно јер ја не знам 184 00:12:49,130 --> 00:12:53,330 Желим да ручно проћи кроз и наћи оно што тражим. 185 00:12:53,330 --> 00:13:01,590 Али само тако можеш видим да сам стварно 186 00:13:01,590 --> 00:13:13,966 користите одговарајућу код, ако се осврнемо на УРЛ за Цраигслист у бикес-- 187 00:13:13,966 --> 00:13:17,460 из неког разлога није пронађен. 188 00:13:17,460 --> 00:13:20,340 Ако погледате ову страницу а ви погледате УРЛ, 189 00:13:20,340 --> 00:13:23,970 ово би требао бити идентичан цУРЛ захтев који сам управо послати. 190 00:13:23,970 --> 00:13:27,700 И заиста, то је оно што се чува у променљивој доц. 191 00:13:27,700 --> 00:13:36,540 >> Дакле, када се вратите на нашу кода, ми онда могу радити на овом доц варијабле 192 00:13:36,540 --> 00:13:40,660 помоћу .ЦСС. 193 00:13:40,660 --> 00:13:49,240 Тако да сам хтео да се све ознаке које су спан.ткт, 194 00:13:49,240 --> 00:13:51,740 и све а ознаке унутар тог тага. 195 00:13:51,740 --> 00:13:56,150 И зашто би желимо да ово, чујем да плачем? 196 00:13:56,150 --> 00:14:02,920 >> Ако Прегледајте Елемент, то вам је даје слом о томе како је структуриран УРЛ. 197 00:14:02,920 --> 00:14:06,200 Ако спустите кроз Овде можете да видите 198 00:14:06,200 --> 00:14:08,770 шта сваки од њих разликује елементи представља. 199 00:14:08,770 --> 00:14:13,410 Дакле, можда сам желите да приступите ова елемента. 200 00:14:13,410 --> 00:14:16,820 Дакле, ја користим Цхроме девелопер алати увида елемент. 201 00:14:16,820 --> 00:14:22,970 Видим овде да је ово је таг у оквиру распона 202 00:14:22,970 --> 00:14:26,230 таг са класе ткт. 203 00:14:26,230 --> 00:14:29,610 >> Дакле, ово стигне до наше Прва операција која 204 00:14:29,610 --> 00:14:37,330 је доц.цсс п, што је ознака да Ја тражим у све ове УРЛ адресе. 205 00:14:37,330 --> 00:14:43,650 А онда .ткт функционише слично као ЦСС ради кад си само писање ЦСС 206 00:14:43,650 --> 00:14:49,630 у вашим фајловима по ХТМЛ наводећи класу. 207 00:14:49,630 --> 00:14:57,980 Дакле, овај конкретни оператер ће навести спан ознаку са класи ткт. 208 00:14:57,980 --> 00:15:02,800 И онда ако оставите размак, то ће онда у том таг 209 00:15:02,800 --> 00:15:05,170 и онда пронадјете таг у то. 210 00:15:05,170 --> 00:15:10,750 >> Дакле, ако сам ставио ово терминал, требао 211 00:15:10,750 --> 00:15:21,630 моћи да виде у суштини све да је у том распону од класе ткт. 212 00:15:21,630 --> 00:15:22,890 Дакле, ми ћемо дати у покрету. 213 00:15:22,890 --> 00:15:25,870 214 00:15:25,870 --> 00:15:27,756 рубин Цраигслист-стругач. 215 00:15:27,756 --> 00:15:31,850 216 00:15:31,850 --> 00:15:37,250 И заиста то нам даје све од њих ознаке различитих листингс који 217 00:15:37,250 --> 00:15:40,400 су на Цраигслист страни. 218 00:15:40,400 --> 00:15:45,670 >> Дакле, ако се вратимо, можемо да окренемо ово у нешто мало више користан. 219 00:15:45,670 --> 00:15:51,050 Можда желимо само линкове. 220 00:15:51,050 --> 00:15:58,790 Зато што у овом ознаком, Такође ћу имају хипервезу путање 221 00:15:58,790 --> 00:16:00,590 да је ова страница иде. 222 00:16:00,590 --> 00:16:09,100 Дакле, ако погледате овај код овде, шта ћу да урадим је уместо .ЦСС, 223 00:16:09,100 --> 00:16:12,380 Могу да идем ат_цсс. 224 00:16:12,380 --> 00:16:16,820 И то ће само добити први елемент све те ствари. 225 00:16:16,820 --> 00:16:20,890 Дакле, ако бих то се у Код Управо сам раније показао, 226 00:16:20,890 --> 00:16:23,800 уместо да се врати све од тога, само би 227 00:16:23,800 --> 00:16:26,850 врати први од њих. 228 00:16:26,850 --> 00:16:31,310 Дакле, тако је оператер ат_цсс ради. 229 00:16:31,310 --> 00:16:39,460 >> Тако да желите да сачувате путања сав првог ознаке. 230 00:16:39,460 --> 00:16:47,430 И јер ће нам дати је-- тако да и даље ћемо користити .ЦСС. 231 00:16:47,430 --> 00:16:53,830 Али пошто ће ово дати да се вратимо цео низ ознака, 232 00:16:53,830 --> 00:16:55,710 ћемо приступ Први елемент. 233 00:16:55,710 --> 00:17:01,700 Дакле, ово је још један начин на који можете приступити неку посебну елемент ако 234 00:17:01,700 --> 00:17:04,810 има низ елемената да се врати, 235 00:17:04,810 --> 00:17:11,930 јер можете третирати нешто што Цсс враћа као низ, у суштини. 236 00:17:11,930 --> 00:17:16,880 А онда ћемо да приступите хипертекст референца атрибут ово. 237 00:17:16,880 --> 00:17:24,810 >> Дакле, ако погледамо, ако сте изгледали јако близу овде, 238 00:17:24,810 --> 00:17:28,270 Ако сте управо суштински погледај УРЛ поље, 239 00:17:28,270 --> 00:17:33,880 ово је пут који ћеш се скидати. 240 00:17:33,880 --> 00:17:41,565 Дакле, ако ми само трчимо ово опет, и уверите се да смо га спасили. 241 00:17:41,565 --> 00:17:47,040 242 00:17:47,040 --> 00:17:48,300 Можете да проверите код куће. 243 00:17:48,300 --> 00:17:51,430 То заправо поклапа са овог линка. 244 00:17:51,430 --> 00:17:55,950 >> Па зашто би желимо да користимо ово? 245 00:17:55,950 --> 00:17:57,870 Ако желите да се потруди страница и има 246 00:17:57,870 --> 00:18:00,270 страница линкова као што су Цраигслист ради, ви 247 00:18:00,270 --> 00:18:03,210 можда ћете желети да се онда у свакој од тим везама 248 00:18:03,210 --> 00:18:05,120 а онда гребу садржај тога, што 249 00:18:05,120 --> 00:18:08,520 је управо оно што ћемо да урадимо. 250 00:18:08,520 --> 00:18:11,660 >> Дакле, када имате путању као променљива, ја више не стварно 251 00:18:11,660 --> 00:18:13,200 брига о штампању га. 252 00:18:13,200 --> 00:18:15,420 Само треба да га чувате као променљиву. 253 00:18:15,420 --> 00:18:20,980 И онда могу приступити други страна на исти начин да приступим 254 00:18:20,980 --> 00:18:22,260 Док на првом месту. 255 00:18:22,260 --> 00:18:25,920 Осим са УРЛ, идемо користити стринг интерполација 256 00:18:25,920 --> 00:18:29,180 као да је описивао у Руби раније да додате 257 00:18:29,180 --> 00:18:32,010 пут до краја корена. 258 00:18:32,010 --> 00:18:38,970 >> Дакле, шта се ово дешава да урадите је да ово ће ставити на путу 259 00:18:38,970 --> 00:18:42,360 да сам раније сцрапед а затим окрените да 260 00:18:42,360 --> 00:18:49,580 у нову ставку, шта год желите да позовите то-- фирст_листинг, на пример. 261 00:18:49,580 --> 00:18:52,900 Али ја ћу отићи то на ставку за сада, 262 00:18:52,900 --> 00:18:55,420 јер то је оно што ја користим овде. 263 00:18:55,420 --> 00:19:02,900 >> Тако да сам хтео да опис првог књижења у Цраигслист. 264 00:19:02,900 --> 00:19:04,740 Тако да ће отићи овде доле. 265 00:19:04,740 --> 00:19:10,660 Ја бих кликнете на прегледајте Елемент Опет, јер је ово опис. 266 00:19:10,660 --> 00:19:14,350 Ја бих овде и види да ли могу наћи како сам могао 267 00:19:14,350 --> 00:19:16,530 бити у стању да тражи овај јединствени таг. 268 00:19:16,530 --> 00:19:19,530 И у овом случају, има лична, што нас доводи 269 00:19:19,530 --> 00:19:26,810 нашем сљедећи начин тражења ознаке, који је са хасхтаг. 270 00:19:26,810 --> 00:19:30,670 >> Дакле, за класе, можете употребили оператор дот. 271 00:19:30,670 --> 00:19:38,610 Дакле, .ткт је наводећи класу ткт, док хасх прецизира личну карту. 272 00:19:38,610 --> 00:19:43,720 Дакле, у овом случају, ознака је секција, а ИД је постингбоди. 273 00:19:43,720 --> 00:19:47,780 >> Дакле, ово иде и проналази фирст-- јер смо 274 00:19:47,780 --> 00:19:51,200 користећи ат_цсс-- ово иде и проналази први елемент који 275 00:19:51,200 --> 00:19:57,180 долази са ознаком члана и ИД постингбоди. 276 00:19:57,180 --> 00:20:02,636 А онда можете да приступите елемент текст те ставке се вратио са .тект. 277 00:20:02,636 --> 00:20:06,230 И онда може похранити да је у опису. 278 00:20:06,230 --> 00:20:09,370 >> Дакле, сада када имамо променљива опис, 279 00:20:09,370 --> 00:20:14,850 можемо бити у стању да уради, рецимо, Филе И / О. Дакле Филе И / О у Руби 280 00:20:14,850 --> 00:20:21,310 је веома сличан поднесе И / О у Ц где смо отворили датотеку. 281 00:20:21,310 --> 00:20:23,260 Можда ћемо писати на њега. 282 00:20:23,260 --> 00:20:25,060 А онда ћемо затворити тај фајл. 283 00:20:25,060 --> 00:20:29,660 >> Дакле, овде, само смо именовање филе, нешто произвољно променљиву. 284 00:20:29,660 --> 00:20:33,120 Ми такође могао само стави ово овде. 285 00:20:33,120 --> 00:20:39,630 Имамо променљиву да смо складиштење отворени фајл и са Филе.опен. 286 00:20:39,630 --> 00:20:46,370 И пишемо у овом фајлу, па смо га отворили са в оператера. 287 00:20:46,370 --> 00:20:54,280 А онда смо ставили стринг Инто тхе филе са оператером .путс. 288 00:20:54,280 --> 00:20:58,310 И онда смо ставили променљиву да Желим да пишем до датотеке у томе. 289 00:20:58,310 --> 00:21:00,200 И онда смо затворили датотеку. 290 00:21:00,200 --> 00:21:04,000 >> Дакле, ако само напред и покрените ово, ово би требало да произведе документ 291 00:21:04,000 --> 00:21:10,840 са Десцриптион.ткт који ће имају овај опис унутар њега. 292 00:21:10,840 --> 00:21:14,015 Дакле, ако сам то-- покренути бр. 293 00:21:14,015 --> 00:21:17,520 294 00:21:17,520 --> 00:21:23,330 То је произвела текстуалну датотеку са, надамо се, иста ствар. 295 00:21:23,330 --> 00:21:25,850 296 00:21:25,850 --> 00:21:33,290 Дакле, можда је нова књижење који је дошао док сам говорио. 297 00:21:33,290 --> 00:21:36,580 И заиста изгледа као да је било. 298 00:21:36,580 --> 00:21:43,380 Дакле, ако одемо у овој класичној бицикл, 1962 до 1966. године, који изгледа да одговара. 299 00:21:43,380 --> 00:21:45,620 И ето га. 300 00:21:45,620 --> 00:21:51,250 >> Дакле, то је најосновнија функционалност гребањем. 301 00:21:51,250 --> 00:21:57,510 Могли би да уместо само писање на ову датотеку, 302 00:21:57,510 --> 00:21:59,930 можемо додати ствари низ. 303 00:21:59,930 --> 00:22:03,770 Дакле, ако Изјављујем три низова, наслов, цена и опис. 304 00:22:03,770 --> 00:22:06,310 305 00:22:06,310 --> 00:22:13,790 И ми ради на доц ставке сада. 306 00:22:13,790 --> 00:22:16,940 Можемо ићи кроз и наћи све од спан.ткт. 307 00:22:16,940 --> 00:22:21,710 И запамтите, ово враћа низ од свих ствари које нађе. 308 00:22:21,710 --> 00:22:27,300 А онда у Руби, можете користити само .Еацх да поновити кроз сваку ставку 309 00:22:27,300 --> 00:22:28,410 низа. 310 00:22:28,410 --> 00:22:31,330 А онда за сваку ставку, Само ћу да га зовем 311 00:22:31,330 --> 00:22:34,620 линк, јер је то у суштини оно што јесте. 312 00:22:34,620 --> 00:22:46,830 >> Дакле, ако сам ставио сваки линк.цсс дот а.хдрлнк, Ово је заправо ће линк 313 00:22:46,830 --> 00:22:58,280 и проналажење унутар тог линка други ХТМЛ елемент и одговарајуће класе. 314 00:22:58,280 --> 00:23:04,990 Дакле, ако се сетимо шта ово је је спан.ткт, 315 00:23:04,990 --> 00:23:13,160 можете СЕЕ само да се вратим прави куицк-- у спан.ткт 316 00:23:13,160 --> 00:23:17,490 имамо пуно других класа. 317 00:23:17,490 --> 00:23:27,180 Тако унутар спан.ткт, тражимо за ознаку са класе хдрлнк. 318 00:23:27,180 --> 00:23:29,890 Дакле, само да сматрају да за момци стварно брзо. 319 00:23:29,890 --> 00:23:37,390 320 00:23:37,390 --> 00:23:42,850 >> Дакле, можете видети овде, ово је таг То је у оквиру распона класе ткт 321 00:23:42,850 --> 00:23:44,920 који има класну хдрлнк. 322 00:23:44,920 --> 00:23:47,610 И то је заиста шта покушавамо да добијемо. 323 00:23:47,610 --> 00:23:54,680 >> Дакле, сада покушавамо да чувате све тих линкова унутар наслова. 324 00:23:54,680 --> 00:23:59,545 А онда ћемо да одштампате сваке од тих линкова. 325 00:23:59,545 --> 00:24:00,360 Не, жао ми је. 326 00:24:00,360 --> 00:24:04,530 Идемо да одштампате цена сваког од њих. 327 00:24:04,530 --> 00:24:09,350 Дакле, хајде да ово стварно брз и види шта ради. 328 00:24:09,350 --> 00:24:14,680 329 00:24:14,680 --> 00:24:17,720 >> Дакле, ово је само у основи кроз сваки од линкова 330 00:24:17,720 --> 00:24:27,310 заузврат, приступљено ознаку у питању, и онда извукао цену. 331 00:24:27,310 --> 00:24:33,910 И то је то урадио јер је након имате све у наслову, 332 00:24:33,910 --> 00:24:37,260 смо управо чувају титулу тамо. 333 00:24:37,260 --> 00:24:40,180 Управо смо чувају везу у оквиру низа наслова. 334 00:24:40,180 --> 00:24:47,720 И у томе за рад петље, где уместо да а.хдрлнк, 335 00:24:47,720 --> 00:24:50,490 тражимо за спан.прице. 336 00:24:50,490 --> 00:24:56,500 Дакле, ако бих могао да јако брзо наћи цена, ако инспекцију елемент, 337 00:24:56,500 --> 00:25:00,610 видећете да је распон са класом цене. 338 00:25:00,610 --> 00:25:04,670 И то је у суштини начин добијамо цену тамо. 339 00:25:04,670 --> 00:25:10,040 >> Дакле, то је заиста Основни случај гребањем. 340 00:25:10,040 --> 00:25:13,550 Тако ти све елементи на страници 341 00:25:13,550 --> 00:25:16,510 да, рецимо, ви већ знате УРЛ. 342 00:25:16,510 --> 00:25:21,050 >> Дакле, ако желимо да добијем мало више у дубину, 343 00:25:21,050 --> 00:25:23,950 можемо чистити странице унутар странице. 344 00:25:23,950 --> 00:25:28,480 И у овом примеру, ја ћу бити излаза у ЦСВ датотеку. 345 00:25:28,480 --> 00:25:39,510 Зато сам захтевају ЦСВ овде јер Руби не, у себи, 346 00:25:39,510 --> 00:25:42,350 има функционалност да само излазне ЦСВ датотеке. 347 00:25:42,350 --> 00:25:45,030 Дакле, то је супер једноставна. 348 00:25:45,030 --> 00:25:48,710 Дозволите ми да пређемо на следеће. 349 00:25:48,710 --> 00:25:51,640 350 00:25:51,640 --> 00:25:57,170 Покрили смо Филе И / О. Дакле, ово је сличан на то како је у Ц. 351 00:25:57,170 --> 00:26:00,870 И пре него што пређемо на кимоно, Ја ћу вам показати како заиста брзо 352 00:26:00,870 --> 00:26:02,790 да се потруди локације унутар знаменитости. 353 00:26:02,790 --> 00:26:10,040 >> Тако смо већ научили како да прогласи низове у Руби. 354 00:26:10,040 --> 00:26:13,280 Дакле, само декларисање гомила произвољних поља 355 00:26:13,280 --> 00:26:16,310 да ћу бити складиштење података изнутра. 356 00:26:16,310 --> 00:26:20,680 Док ради на исти начин као што је био у претходном фајлу. 357 00:26:20,680 --> 00:26:23,580 Идемо у, проналажење сваки од тих спан.ткт. 358 00:26:23,580 --> 00:26:25,040 Већ знамо да. 359 00:26:25,040 --> 00:26:32,130 То је контејнер унутар којег сваки веза има све податке које желимо. 360 00:26:32,130 --> 00:26:40,800 >> Ево шта ми радимо је за сваку карика спан цласс ткт, идемо у 361 00:26:40,800 --> 00:26:45,720 а ми проналажење ознаку, проналажење први елемент тога. 362 00:26:45,720 --> 00:26:49,937 Запамтите, .ЦСС враћа низ, тако да не можете само приступити као што је. 363 00:26:49,937 --> 00:26:51,520 Ми ћемо наћи први елемент. 364 00:26:51,520 --> 00:26:56,430 Чак и ако је то низ једног ставка, морате да користите ову синтаксу, 365 00:26:56,430 --> 00:26:58,800 а затим извуците хреф атрибут. 366 00:26:58,800 --> 00:27:01,800 >> То смо и урадили раније. 367 00:27:01,800 --> 00:27:04,440 Дакле, ово би требало да изгледа познато. 368 00:27:04,440 --> 00:27:14,330 И тако сада имамо низ тзв стазе свих наших линкова 369 00:27:14,330 --> 00:27:16,590 да ћемо желите да користите. 370 00:27:16,590 --> 00:27:21,350 Дакле, ако имамо овај низ свега од стаза које желимо да користимо, 371 00:27:21,350 --> 00:27:26,840 онда можемо створити ставку за сваки тих страница када отворимо ту страницу. 372 00:27:26,840 --> 00:27:31,150 Дакле, као што смо и видели на синтакса пре, гдје 373 00:27:31,150 --> 00:27:37,450 ради стринг интерполација са путањом овде, тако да је синтакса је само за стазу. 374 00:27:37,450 --> 00:27:41,450 И могао бих навести ово променљива било произвољно име. 375 00:27:41,450 --> 00:27:43,070 >> Ово је важна. 376 00:27:43,070 --> 00:27:46,650 Ово је низ да ћеш бе приступ сваком елементу. 377 00:27:46,650 --> 00:27:52,400 Али када кажете за пут у путеве, то значи за сваки елемент у стазама, 378 00:27:52,400 --> 00:27:55,150 позовите га пут, и користи га. 379 00:27:55,150 --> 00:27:59,266 Ово је у суштини кад вас урадите за петљу и користите инт и. 380 00:27:59,266 --> 00:28:04,000 Дакле, можете третирати пут као варијабла која је инцрементинг. 381 00:28:04,000 --> 00:28:07,820 >> А онда за сваку од њих, иду у сваки од тих линкова. 382 00:28:07,820 --> 00:28:11,710 Зато што је складиштење у тачки страници, тако да правите нову страницу сваки пут 383 00:28:11,710 --> 00:28:13,330 смо јој приступе. 384 00:28:13,330 --> 00:28:20,560 А онда у том новој страници, наћи спан.постингтитлетект, спан.прице, 385 00:28:20,560 --> 00:28:22,240 а затим одељак # постингбоди. 386 00:28:22,240 --> 00:28:28,430 Ми смо већ покривени Сецтион # постингбоди када смо гледали у опису. 387 00:28:28,430 --> 00:28:34,890 >> Тако можемо да видимо у Цраигслист пост, ако само гледате у наслову, 388 00:28:34,890 --> 00:28:38,810 можете видети овде, п постингтитлетект. 389 00:28:38,810 --> 00:28:41,390 И зато је ту. 390 00:28:41,390 --> 00:28:49,120 А онда за цијену, можете приступити га спан цласс цене. 391 00:28:49,120 --> 00:28:54,480 >> Тако смо и можда би могло желите да сачувате УРЛ. 392 00:28:54,480 --> 00:28:58,580 Дакле, ми ћемо покренути ово Опет, чувајте је у низу, 393 00:28:58,580 --> 00:29:01,150 јер ако гледате на Цраигслист, ти си 394 00:29:01,150 --> 00:29:05,290 Вероватно ће желети пут до, ако видиш нешто што вас интересује, 395 00:29:05,290 --> 00:29:06,620 вратимо на тај сајт. 396 00:29:06,620 --> 00:29:10,480 Дакле, само желите да сачувате УРЛ за референце ради. 397 00:29:10,480 --> 00:29:13,840 398 00:29:13,840 --> 00:29:19,630 >> Ово је само битно друга синтакса за фор петљу. 399 00:29:19,630 --> 00:29:26,360 Могао бих да уместо патхс.еацх од за пут у путеве са индексом. 400 00:29:26,360 --> 00:29:31,280 А ово синтакса је Руби за-- Пут је оно што смо урадили овде, 401 00:29:31,280 --> 00:29:33,920 проглашавајући променљиву за сваку ставку. 402 00:29:33,920 --> 00:29:38,540 И индекс се понаша као Тхе И Ин Ц петљи. 403 00:29:38,540 --> 00:29:41,280 Тако да можете пратити шта је индекс. 404 00:29:41,280 --> 00:29:45,200 >> Дакле, овде је само мала ствар згодно 405 00:29:45,200 --> 00:29:46,950 када сте покренули су лопатице. 406 00:29:46,950 --> 00:29:50,580 Ако стругање стотине страница, да се уверите да није виси, 407 00:29:50,580 --> 00:29:53,320 то ће само излаз, Ја сам приступ овој страници, 408 00:29:53,320 --> 00:29:55,960 и пазећи да то је и даље наставља. 409 00:29:55,960 --> 00:29:59,250 Али за наше потребе, јер Постоји стотину ствари, 410 00:29:59,250 --> 00:30:08,000 Идем да приступите само три од њих тако да не понестане времена овде. 411 00:30:08,000 --> 00:30:13,040 >> Али пре него што дођемо до тога, ја сам ће вам показати веома брзо, 412 00:30:13,040 --> 00:30:16,940 Ја ћу бити излаза титулу, цена, опис, и УРЛ 413 00:30:16,940 --> 00:30:19,600 сваког од линкова које сам подераним. 414 00:30:19,600 --> 00:30:23,720 И онда је ово само синтакса за ЦСВ библиотеку. 415 00:30:23,720 --> 00:30:25,240 Ви отворите ЦСВ. 416 00:30:25,240 --> 00:30:27,070 То је оно што ћу да га зовем. 417 00:30:27,070 --> 00:30:29,430 Отворите га писања до. 418 00:30:29,430 --> 00:30:33,830 А онда ЦСВ ће бити фајл који ви уносите све у. 419 00:30:33,830 --> 00:30:37,800 Ово је само за проверу исправности да знам да се то ради. 420 00:30:37,800 --> 00:30:41,240 А ово је мој разум чек да знају да је завршен. 421 00:30:41,240 --> 00:30:46,670 Зато ја постављам титулу у низу у ЦСВ, цена, урл, опис, 422 00:30:46,670 --> 00:30:49,420 све у редове у ЦСВ. 423 00:30:49,420 --> 00:30:53,410 >> Дакле, ако одемо и покренути ово сада-- и сам 424 00:30:53,410 --> 00:31:04,710 уверите се да то-- уместо смо спасили од само излаза на терминал, 425 00:31:04,710 --> 00:31:09,750 треба да имамо ЦСВ датотека која је произвела. 426 00:31:09,750 --> 00:31:13,500 Дакле, овде можемо да видимо ЦСВ датотека која је произведена. 427 00:31:13,500 --> 00:31:19,330 Ово је излаз из сцапе да сам побегао. 428 00:31:19,330 --> 00:31:23,030 Као што можете видети овде, Приступање страна 0, 1, 2, 3. 429 00:31:23,030 --> 00:31:27,400 Ово су наслови, цијене, описи. 430 00:31:27,400 --> 00:31:31,710 И ако погледамо овај ЦСВ фајл који смо генерише, 431 00:31:31,710 --> 00:31:35,700 можете видети његова имати излаз овде. 432 00:31:35,700 --> 00:31:40,350 То није Екцел, тако да није форматиран у редове и колоне. 433 00:31:40,350 --> 00:31:45,140 Али можете да замислите колико то може бити форматиран. 434 00:31:45,140 --> 00:31:47,740 >> ЦСВ залаже за вредности раздвојене зарезима. 435 00:31:47,740 --> 00:31:50,090 Дакле, можете замислити да би то било ред. 436 00:31:50,090 --> 00:31:54,700 И сваки зарез би указују на посебној колони. 437 00:31:54,700 --> 00:32:00,010 Само реч цаутион-- понекад си 438 00:32:00,010 --> 00:32:02,260 стругање ствари са пуно зарезима. 439 00:32:02,260 --> 00:32:05,100 Дакле, ако сте оутпуттинг је у ЦСВ датотеку, 440 00:32:05,100 --> 00:32:10,340 то можда не емитујете како ти мислиш. 441 00:32:10,340 --> 00:32:16,770 >> Дакле, то је у суштини све ту је стругање основни ХТМЛ 442 00:32:16,770 --> 00:32:20,110 страница са нокогири. 443 00:32:20,110 --> 00:32:26,000 >> Дакле, интернет бића иновативан као што је дошао до 444 00:32:26,000 --> 00:32:33,220 са више аутоматизована и ГУИ верзија, иако мање робустан 445 00:32:33,220 --> 00:32:35,540 верзија стругање разних сајтова. 446 00:32:35,540 --> 00:32:39,060 И за наше потребе Ја ћу се демонстрира 447 00:32:39,060 --> 00:32:42,920 Цхроме екстензија Кимоно. 448 00:32:42,920 --> 00:32:46,690 И све што треба да урадите је да се крећете на страници коју желите да се потруди. 449 00:32:46,690 --> 00:32:48,590 Ви кликните на области интересовања. 450 00:32:48,590 --> 00:32:51,510 Ви калибрацију поља, јер аутоматски ће 451 00:32:51,510 --> 00:32:54,360 открити оно што мисли желите да будете стругање, 452 00:32:54,360 --> 00:32:56,280 и онда само створити АПИ. 453 00:32:56,280 --> 00:33:03,700 >> Дакле, ако смо да га покаже на Цраигслист, заправо не би ишло. 454 00:33:03,700 --> 00:33:08,290 И то је оно што сам хтео вратити каже о томе не буде као робустан. 455 00:33:08,290 --> 00:33:10,320 Она има проблема ствара АПИ. 456 00:33:10,320 --> 00:33:13,400 Али као демонстрацију онога што ће учинити, 457 00:33:13,400 --> 00:33:17,460 ако инсталирате додатак за Цхроме, све што урадите је да кликнете на њега. 458 00:33:17,460 --> 00:33:21,750 То Кимонофиес страницу, а затим вас кликните на ствар коју желите да скрипта. 459 00:33:21,750 --> 00:33:24,480 >> Дакле, ако сам ја да кликну на тога, не би означите 460 00:33:24,480 --> 00:33:28,130 оно што мисли да желим да бити стругање ван ту страницу. 461 00:33:28,130 --> 00:33:33,660 Можда ја називам ову огласа. 462 00:33:33,660 --> 00:33:36,430 Ово је колико ствари сам изабран. 463 00:33:36,430 --> 00:33:43,810 И само да потврдити или негирати неке других предложених листингс 464 00:33:43,810 --> 00:33:49,600 да се додати шта ће бити сцрапед. 465 00:33:49,600 --> 00:33:52,330 >> Дакле, сада можемо да видимо ту изабран стотину ствари. 466 00:33:52,330 --> 00:33:58,060 Ако желим да имам још једно поље које сам Такође сцрапе који се односи на ово, 467 00:33:58,060 --> 00:34:02,540 кажем да желим да састругати цену као и онда могу да урадим исто. 468 00:34:02,540 --> 00:34:06,190 469 00:34:06,190 --> 00:34:11,550 >> Дакле, овде је демонстрација како је то много мање робустан, јер сада је 470 00:34:11,550 --> 00:34:15,050 покупити град уместо да само цена коју желим. 471 00:34:15,050 --> 00:34:16,989 А сада је покупио 200 ствари. 472 00:34:16,989 --> 00:34:19,880 Можете се вратити и избрисати. 473 00:34:19,880 --> 00:34:21,449 Можете покушати поново. 474 00:34:21,449 --> 00:34:24,250 Али нема гаранције. 475 00:34:24,250 --> 00:34:29,909 Ово је како то ради понекад. 476 00:34:29,909 --> 00:34:32,969 Као што видите овде, сада пише 96 овде. 477 00:34:32,969 --> 00:34:37,000 То је покупио највише линкова да желите да се потруди, али не 478 00:34:37,000 --> 00:34:39,280 нужно све њих. 479 00:34:39,280 --> 00:34:43,909 >> Још једна корисна алатка за Кимоно иако је можете да одете на напредне функције 480 00:34:43,909 --> 00:34:47,980 овде, идите на Адванцед, и она ће вам показати 481 00:34:47,980 --> 00:34:53,139 слом јединствена начин да приступите ХТМЛ 482 00:34:53,139 --> 00:34:54,909 ознаке које желите да се потруди. 483 00:34:54,909 --> 00:35:01,450 Дакле, за котацију, ако погледате овде, ако приступате стр стиле див спан А, 484 00:35:01,450 --> 00:35:06,030 заправо можете једноставно користити ово у нокогири коду, 485 00:35:06,030 --> 00:35:10,780 где пре него што смо спан.ткт за приступ сваки од листингс. 486 00:35:10,780 --> 00:35:13,270 Ако Хоћу само текст у оквиру листама, 487 00:35:13,270 --> 00:35:18,950 Могао бих улаз див простор стр Простор п простор п простор А, 488 00:35:18,950 --> 00:35:21,570 и да ће постигао исти ефекат. 489 00:35:21,570 --> 00:35:26,320 А за оне који су заинтересовани у помоћу регуларних израза, 490 00:35:26,320 --> 00:35:31,670 то се дешава да вам се дају редовно израз врста низа на улаз 491 00:35:31,670 --> 00:35:34,900 да пронађе ствари ви покушавате да пронађете. 492 00:35:34,900 --> 00:35:44,130 >> Дакле, постоји још једна кул карактеристика Кимоно за где можете пагинате, 493 00:35:44,130 --> 00:35:47,780 што није само могу да сцрапе резултати ове странице, 494 00:35:47,780 --> 00:35:50,890 Могу да кликнете на овај мали дугме овде, Пагинатион, 495 00:35:50,890 --> 00:35:55,580 навести дугме да би поведи ме на следећу страницу, 496 00:35:55,580 --> 00:35:59,500 а онда ће само знам да може поновити на следећој страници, 497 00:35:59,500 --> 00:36:04,120 и онда састругати све док до-- јер је исти формат цоурсе-- 498 00:36:04,120 --> 00:36:06,110 сцапе свих тих линкова као добро. 499 00:36:06,110 --> 00:36:15,230 >> Зато што кимоно не жели да рад са Цраигслист, шта смо урадили 500 00:36:15,230 --> 00:36:19,790 је сам Кимонофиед на Харвард Цримсон. 501 00:36:19,790 --> 00:36:29,380 Ја сам извукао неке од врсте Топ феатуред чланци, потврдили овде. 502 00:36:29,380 --> 00:36:33,090 Реци све ово. 503 00:36:33,090 --> 00:36:35,830 Ја сам саставио овај АПИ за вас испред времена. 504 00:36:35,830 --> 00:36:38,990 Иначе шта бисте урадили је само да кликните на Доне. 505 00:36:38,990 --> 00:36:40,940 Унесите у вашим АПИ детаља. 506 00:36:40,940 --> 00:36:45,260 Поставите га на било аутоматска или ручна пузати. 507 00:36:45,260 --> 00:36:48,460 Да би могао да Упдате Иоур Подаци на сваких 15 минута, 508 00:36:48,460 --> 00:36:50,330 недељно, дневни, шта год желите. 509 00:36:50,330 --> 00:36:51,160 Име вашег АПИ. 510 00:36:51,160 --> 00:36:52,790 Креирајте АПИ. 511 00:36:52,790 --> 00:36:58,460 За твоју корист, ја сам створио Цримсон већ насловној страни АПИ. 512 00:36:58,460 --> 00:37:02,480 >> Дакле, само створити налог на кимоно, и 513 00:37:02,480 --> 00:37:06,240 ће сачувати све своје АПИ за вас. 514 00:37:06,240 --> 00:37:10,330 У суштини то је све ваше одвојене различите огреботина. 515 00:37:10,330 --> 00:37:18,250 >> Дакле, ако погледамо овде, ово је мишљења линкови које сам прикупљени. 516 00:37:18,250 --> 00:37:21,290 То су феатуред линкови које сам прикупљени. 517 00:37:21,290 --> 00:37:24,090 А ово су најчитанији линкови које сам прикупљени 518 00:37:24,090 --> 00:37:27,120 из овог најновијег АПИ предела. 519 00:37:27,120 --> 00:37:30,790 >> Дакле, ако можете видети овде, то ће бити представљен, 520 00:37:30,790 --> 00:37:34,130 то би било мишљења, која у овом примеру, 521 00:37:34,130 --> 00:37:38,150 Ја сам их комбиновати све у једну колекцију. 522 00:37:38,150 --> 00:37:42,780 Али, ако само играте са њом мало, можете поделити 523 00:37:42,780 --> 00:37:45,090 и поделите га међутим желите да докле 524 00:37:45,090 --> 00:37:47,520 као форматирање је нешто другачија. 525 00:37:47,520 --> 00:37:51,320 >> Само да се играте са тим, краул поставили, један од мана 526 00:37:51,320 --> 00:37:58,120 је можете само да подвуцем до 25 страница у исто време. 527 00:37:58,120 --> 00:38:00,430 То је један од ограничавајућих фактора. 528 00:38:00,430 --> 00:38:03,060 Али овде, ако га подесите на ручно пузати, ово 529 00:38:03,060 --> 00:38:06,100 како ви то можете рећи да ажурира своје податке. 530 00:38:06,100 --> 00:38:11,010 И овде можете видети историју пописивања од свега што сте пописивање. 531 00:38:11,010 --> 00:38:16,000 И ви можете да се вратите, пријавите, играте са свим различите начине 532 00:38:16,000 --> 00:38:20,340 да можете изменити и користити своје податке. 533 00:38:20,340 --> 00:38:24,580 >> Кимоно може да се подеси до сцрапе везе унутар везе. 534 00:38:24,580 --> 00:38:29,700 И ти би то урадили прво стругање листу линкова, 535 00:38:29,700 --> 00:38:35,390 а затим користите тај АПИ виду скочим тачка за још један АПИ 536 00:38:35,390 --> 00:38:36,710 да направите скрипту. 537 00:38:36,710 --> 00:38:42,040 Али то је компликованије него шта ћемо да уђемо у данас. 538 00:38:42,040 --> 00:38:44,270 >> Дакле, то је кимоно. 539 00:38:44,270 --> 00:38:46,980 Причаћемо о предностима и мане нокогири и Кимоно. 540 00:38:46,980 --> 00:38:50,380 >> Нокогири, то је стварно брзо. 541 00:38:50,380 --> 00:38:51,640 То је лако тестирати. 542 00:38:51,640 --> 00:38:55,910 Треба само да ставља ништа конзола, лако се подешавају. 543 00:38:55,910 --> 00:39:00,400 Можете одлучити шта тачно желите да се потруди и продавница. 544 00:39:00,400 --> 00:39:02,060 Не постоје ограничења страница. 545 00:39:02,060 --> 00:39:08,010 Ја заправо користи да се потруди као 1800 Соутх Африцан школа сајтови 546 00:39:08,010 --> 00:39:10,870 за е-пошту за стажирање које сам учинио. 547 00:39:10,870 --> 00:39:16,060 >> Дакле, то је могуће, мада најбоље праксе био би да се раздвојимо сценарио. 548 00:39:16,060 --> 00:39:19,310 Јер, ако не, онда да не добијете ништа. 549 00:39:19,310 --> 00:39:22,790 Али, ако то урадите стотину, можда 200 пагес ат а тиме, 550 00:39:22,790 --> 00:39:27,840 онда имате неку шансу да бар то се парче, посебно 551 00:39:27,840 --> 00:39:30,280 ако имате лошу интернет. 552 00:39:30,280 --> 00:39:32,720 >> Нажалост, то само може сцрапе ХТМЛ. 553 00:39:32,720 --> 00:39:35,190 Дакле, ако имате динамички лоадед пагес-- 554 00:39:35,190 --> 00:39:39,480 а ја ћу вам показати пример као Каиак Ин А секунду-- 555 00:39:39,480 --> 00:39:42,270 Нокогири жалост Не могу да сцрапе. 556 00:39:42,270 --> 00:39:45,700 >> Али, кимоно је и једноставан за коришћење. 557 00:39:45,700 --> 00:39:48,330 Као што сте видели, то је у суштини тачка и клик. 558 00:39:48,330 --> 00:39:50,260 То може сцрапе ЈаваСцрипт. 559 00:39:50,260 --> 00:39:53,790 Нажалост, постоји максимална да колико страница можете сцрапе. 560 00:39:53,790 --> 00:39:55,710 Понекад је мало Тешко да подесите. 561 00:39:55,710 --> 00:39:57,240 То збуни. 562 00:39:57,240 --> 00:40:00,920 Али то је дефинитивно нешто да се размотри 563 00:40:00,920 --> 00:40:05,930 ако не покушавате да имају Супер робустан одржив огреботина. 564 00:40:05,930 --> 00:40:09,010 Ако само желите да све са странице брзо, 565 00:40:09,010 --> 00:40:10,970 онда кимоно је стварно добар алат за коришћење. 566 00:40:10,970 --> 00:40:16,490 И као што сам раније поменуо, ту је напредни карактеристика Кимоно 567 00:40:16,490 --> 00:40:19,260 који вам показује како да приступити јединствену ХТМЛ 568 00:40:19,260 --> 00:40:24,210 елемент, који је супер корисно још ако радите у нокогири. 569 00:40:24,210 --> 00:40:30,370 >> Дакле, ако одемо у Каиак сајту, за пример, можете да видите је-- 570 00:40:30,370 --> 00:40:31,750 или можда не можете да видите. 571 00:40:31,750 --> 00:40:38,910 Али, ако вам покажем УРЛ за Каиак, ово је заправо само изворни УРЛ. 572 00:40:38,910 --> 00:40:43,800 Ово је УРЛ пре него што је модификована на било који ЈаваСцрипт скрипте 573 00:40:43,800 --> 00:40:45,350 да су дешава. 574 00:40:45,350 --> 00:40:52,420 И то ће изгледати другачије из инспекције елемент. 575 00:40:52,420 --> 00:40:55,940 >> Дакле, ако прођем и подударају Уп Тхе Проверите елемената 576 00:40:55,940 --> 00:41:00,340 Код са изворног кода, то је у ствари ће бити другачије. 577 00:41:00,340 --> 00:41:05,640 И то је у суштини разлог нокогири Не могу чистити динамички оптерећених локације. 578 00:41:05,640 --> 00:41:08,810 Пошто је нокогири стругање изворни УРЛ, 579 00:41:08,810 --> 00:41:16,310 док кимоно је заправо стругање оно што у суштини 580 00:41:16,310 --> 00:41:18,260 види Изаберите Елемент. 581 00:41:18,260 --> 00:41:23,880 >> Дакле, ако одем преко и покушати да Кимонофи Кајак, 582 00:41:23,880 --> 00:41:26,600 Ја заправо могу проћи кроз и изаберите цену. 583 00:41:26,600 --> 00:41:32,360 То је мало теже, и у овом случају, то је 584 00:41:32,360 --> 00:41:36,600 заправо виде ову цену за разлику од њих. 585 00:41:36,600 --> 00:41:41,110 Дакле, док можете цонфигуре-- или ако то нису динамички лоадед, 586 00:41:41,110 --> 00:41:43,620 можете да конфигуришете нокогири да се све ово. 587 00:41:43,620 --> 00:41:48,230 >> Зато што форматирање је незнатно различит за овај унос 588 00:41:48,230 --> 00:41:51,280 као што је у односу на остатак од њих, и можете видети овде 589 00:41:51,280 --> 00:41:54,830 то је заиста отишла и Одабрани све цене летова. 590 00:41:54,830 --> 00:42:01,200 Можда желим да изаберете време лета, као добро. 591 00:42:01,200 --> 00:42:04,700 И ја могу проћи кроз и некако конфигурирати то. 592 00:42:04,700 --> 00:42:06,950 Не желим то. 593 00:42:06,950 --> 00:42:10,200 Ја само желим времена за следећи лет је. 594 00:42:10,200 --> 00:42:17,030 А онда након пар њих пролази кроз то добија слику. 595 00:42:17,030 --> 00:42:19,080 Дакле, кимоно је прилично паметан. 596 00:42:19,080 --> 00:42:21,900 То није толико робустан. 597 00:42:21,900 --> 00:42:26,710 >> Постоје неке друге алтернативе које можете користити. 598 00:42:26,710 --> 00:42:31,600 А ја ћу вам показати их овде. 599 00:42:31,600 --> 00:42:35,790 Ако сте удобније у Питон уместо Руби можда, 600 00:42:35,790 --> 00:42:39,290 постоји је библиотека звала Лепа супа. 601 00:42:39,290 --> 00:42:40,430 Можете користити то. 602 00:42:40,430 --> 00:42:42,270 То је врло слично нокогири. 603 00:42:42,270 --> 00:42:44,620 Има још неколико функција. 604 00:42:44,620 --> 00:42:52,160 Можете наћи ХТМЛ тагове и онда помери или преместите у страну. 605 00:42:52,160 --> 00:42:54,690 >> Ту је ПиКт. 606 00:42:54,690 --> 00:42:57,820 Ово може заправо сцрапе динамички сајтови, јер је то на неки начин 607 00:42:57,820 --> 00:43:02,540 је ВебКит која претендује да буде бровсер без било заиста 608 00:43:02,540 --> 00:43:03,670 као бровсер. 609 00:43:03,670 --> 00:43:07,490 Тако да би чекати све Скрипта да би сте прво учита, а затим 610 00:43:07,490 --> 00:43:09,560 иди и покушати очистити сајт. 611 00:43:09,560 --> 00:43:13,560 >> Ако желите да држите Руби, могу ићи један ниво горе од нокогири. 612 00:43:13,560 --> 00:43:17,650 Можете користити Цапибара са Полтергеист омотач. 613 00:43:17,650 --> 00:43:22,910 И ово може стварно у суштини раде исту ствар 614 00:43:22,910 --> 00:43:26,610 ас ПиКт, која је то је ВебКит. 615 00:43:26,610 --> 00:43:29,610 То чека за Скрипта да би сте прво учита. 616 00:43:29,610 --> 00:43:33,340 Ако петља око њега довољно са, можете чак и да га да кликнете на ствари. 617 00:43:33,340 --> 00:43:42,780 >> Дакле, ако постоји линк који није класичан хреф где 618 00:43:42,780 --> 00:43:46,350 пут је лако доступна, и да је то нека ствар која детектује ЈаваСкрипт 619 00:43:46,350 --> 00:43:49,490 клик, ви заправо можеш то да урадиш. 620 00:43:49,490 --> 00:43:53,430 Што више популаран библиотека да симулира корисника 621 00:43:53,430 --> 00:43:56,390 је у ЈаваСцрипт, што је ПхантомЈС. 622 00:43:56,390 --> 00:44:01,010 Ово може очигледно сцрапе динамички сајтови, јер Ово је у суштини 623 00:44:01,010 --> 00:44:04,270 претварајући се да Хром без корисничког интерфејса. 624 00:44:04,270 --> 00:44:09,970 >> И онда, наравно највише робустан, али најспорији опцију, 625 00:44:09,970 --> 00:44:13,260 Селен је браузер аутоматизацију. 626 00:44:13,260 --> 00:44:15,550 И, нажалост, нећеш бити 627 00:44:15,550 --> 00:44:19,770 у стању да уради у вашој ЦС50 ИДЕ. 628 00:44:19,770 --> 00:44:24,140 Јер, у суштини то Да ли је то покреће свој Цхроме, 629 00:44:24,140 --> 00:44:27,090 Сафари, без обзира претраживач који желите да користите, 630 00:44:27,090 --> 00:44:32,570 а можда прати ваш миш покрет, шта год укуцали у, 631 00:44:32,570 --> 00:44:35,170 и то само врста аутоматизује овај процес. 632 00:44:35,170 --> 00:44:42,070 Дакле, то је развијен као нека врста сајт аутоматизација тестирања алата. 633 00:44:42,070 --> 00:44:45,910 Али многи људи користе Селен да се потруди сајтова 634 00:44:45,910 --> 00:44:49,990 да иначе имају Много тешко стругање 635 00:44:49,990 --> 00:44:53,700 са неким од ових других, бржим алате. 636 00:44:53,700 --> 00:44:57,530 >> Дакле, то је све што имам за веб гребањем. 637 00:44:57,530 --> 00:44:58,090 Забавите се. 638 00:44:58,090 --> 00:45:01,762 639 00:45:01,762 --> 00:45:02,680 >> ПУБЛИКА: Питање. 640 00:45:02,680 --> 00:45:04,016 >> Роберт КРАБЕК: Да. 641 00:45:04,016 --> 00:45:12,840 >> ПУБЛИКА: Да ли постоји механизам за хасх веб сајт тако да у суштини могао 642 00:45:12,840 --> 00:45:14,207 проћи кроз њега касније. 643 00:45:14,207 --> 00:45:15,040 Роберт КРАБЕК: Да. 644 00:45:15,040 --> 00:45:21,530 Дакле, ставимо у наш Пример, за обоје, 645 00:45:21,530 --> 00:45:24,980 ставимо цео сајт у доц. 646 00:45:24,980 --> 00:45:31,260 И тако би стварно могао само узмите променљива доц и записати га у фајл. 647 00:45:31,260 --> 00:45:35,490 Дакле, ако сам хтео, могао сам напиши га као ХТМЛ датотеку, 648 00:45:35,490 --> 00:45:39,280 а потом уместо да користите ОпенУРИ и увијени захтев, 649 00:45:39,280 --> 00:45:43,520 онда бих могао да отворим доц ХТМЛ и онда тражити за то. 650 00:45:43,520 --> 00:45:47,960 >> ПУБЛИКА: Али можете сачувати врста онлине искуство 651 00:45:47,960 --> 00:45:48,930 док радите ван мреже. 652 00:45:48,930 --> 00:45:51,013 Na primer. када сте лети неколико сати, 653 00:45:51,013 --> 00:45:54,070 Желим да у суштини архива цео сајт. [Неразумљиво] 654 00:45:54,070 --> 00:45:58,780 >> Роберт КРАБЕК: Да, то је екацтли-- тако да буквално шта то ради 655 00:45:58,780 --> 00:46:03,010 да ли је узима све то би било на овој адреси. 656 00:46:03,010 --> 00:46:11,280 Дакле, ако ран Цурл, то је Имајући све ове ХТМЛ, 657 00:46:11,280 --> 00:46:14,590 и то складиштења унутар променљиве доц. 658 00:46:14,590 --> 00:46:17,290 Онда можете да урадите шта год желите да урадите са доц. 659 00:46:17,290 --> 00:46:18,575 Можете да излаз у датотеку. 660 00:46:18,575 --> 00:46:19,950 ПУБЛИКА: Али то није повезано. 661 00:46:19,950 --> 00:46:20,780 То није динамична. 662 00:46:20,780 --> 00:46:22,770 Није рекурзивни, зар не? 663 00:46:22,770 --> 00:46:24,016 Видиш шта мислим? 664 00:46:24,016 --> 00:46:28,359 Покушавам да у основи врсту хасх цео сајт на мом хард диску 665 00:46:28,359 --> 00:46:31,150 тако да сам практично могао то да урадим за неколико сати без Интернета. 666 00:46:31,150 --> 00:46:32,025 >> Роберт КРАБЕК: Тако је. 667 00:46:32,025 --> 00:46:37,140 Дакле, ако сам хад-- па где је мој досије И / О? 668 00:46:37,140 --> 00:46:47,766 Дакле, ово је фајл И / О. Тако кажу, уместо ово, Ја ово зовем цраигслист.хтмл. 669 00:46:47,766 --> 00:46:52,620 670 00:46:52,620 --> 00:46:53,940 Ја бих отворити то. 671 00:46:53,940 --> 00:46:59,020 Ја бих ставља докторе у њу. 672 00:46:59,020 --> 00:47:00,470 Затворим датотеку. 673 00:47:00,470 --> 00:47:05,410 И онда само зато што је ЦС50 ИДЕ је на облаку, то је свеједно. 674 00:47:05,410 --> 00:47:07,710 Могу да идем овде. 675 00:47:07,710 --> 00:47:09,320 Ја могу преузети фајл. 676 00:47:09,320 --> 00:47:11,830 И онда би то било на мом хард диску. 677 00:47:11,830 --> 00:47:13,930 Дакле, можете то урадити на тај начин. 678 00:47:13,930 --> 00:47:18,830 Или ако сте код куће, не користећи ЦС50 ИДЕ као Сублиме или тако нешто, 679 00:47:18,830 --> 00:47:21,900 ово је још лакше, јер ово је све доступно на локалном нивоу, 680 00:47:21,900 --> 00:47:23,020 није везан на интернет. 681 00:47:23,020 --> 00:47:24,720 >> ПУБЛИКА: Видим. 682 00:47:24,720 --> 00:47:26,580 Ово је за једног одређеног проблема. 683 00:47:26,580 --> 00:47:30,410 Можеш ли то рекурсивно тако да го неколико слојева дубоко врсту ствари? 684 00:47:30,410 --> 00:47:33,801 >> Роберт КРАБЕК: Могу преузети фасцикле као и, ако је то оно што питаш. 685 00:47:33,801 --> 00:47:34,426 ПУБЛИКА: Да. 686 00:47:34,426 --> 00:47:39,890 687 00:47:39,890 --> 00:47:41,440 >> Роберт КРАБЕК: Кул. 688 00:47:41,440 --> 00:47:43,182