Okej, sÃ¥, berÃ¤kningskomplexitet. Bara en bit av en varning innan vi dyker i fÃ¶r far-- Detta kommer fÃ¶rmodligen att vara bland de matematiktunga saker vi talar om i CS50. FÃ¶rhoppningsvis kommer det inte vara alltfÃ¶r Ã¶vervÃ¤ldigande och vi ska fÃ¶rsÃ¶ka guida dig genom processen, men bara en bit av en rÃ¤ttvis varning. Det finns en liten bit matematik inblandade hÃ¤r. Okej, sÃ¥ fÃ¶r att gÃ¶ra anvÃ¤ndning av vÃ¥ra berÃ¤kningsresurser i den verkliga world-- det verkligen viktigt att fÃ¶rstÃ¥ algoritmer och hur de behandlar uppgifter. Om vi ââhar en riktigt effektiv algoritm, vi kan minimera mÃ¤ngden resurser vi har till fÃ¶rfogande fÃ¶r att ta itu med det. Om vi ââhar en algoritm som kommer att ta en hel del arbete att bearbeta en riktigt stor uppsÃ¤ttning av data, Ã¤r det kommer att krÃ¤va mer och mer resurser, vilket Ã¤r pengar, RAM, alla den typen av saker. 

SÃ¥, att kunna analysera en algoritm att anvÃ¤nda detta verktyg set, princip frÃ¥gar question-- hur fungerar denna algoritm skala som vi kastar mer och mer data pÃ¥ det? I CS50, mÃ¤ngden data som vi Ã¤r arbetar med Ã¤r ganska liten. Generellt Ã¤r vÃ¥ra program gÃ¥r att kÃ¶ra i en andra eller less-- fÃ¶rmodligen mycket mindre sÃ¤rskilt tidigt. 

Men tÃ¤nk om ett fÃ¶retag som behandlar med hundratals miljoner kunder. Och de behÃ¶ver fÃ¶r att bearbeta kunden uppgifter. Eftersom antalet kunder som de har blir stÃ¶rre och stÃ¶rre, det kommer att krÃ¤va mer och mer resurser. Hur mÃ¥nga fler resurser? Tja, det beror pÃ¥ hur vi analyserar algoritmen, med hjÃ¤lp av verktygen i verktygslÃ¥dan. NÃ¤r vi talar om komplexiteten i en algorithm-- som ibland du kommer hÃ¶ra det kallas tid komplexitet eller utrymme komplexitet men vi ska bara ringa complexity-- vi generellt talar om det vÃ¤rsta scenariot. Med tanke pÃ¥ den absolut vÃ¤rsta hÃ¶gen av data som vi kan kasta pÃ¥ det, Hur Ã¤r denna algoritm kommer att bearbeta eller ta itu med dessa uppgifter? Vi kallar allmÃ¤nhet vÃ¤rsta fall runtime av en algoritm big-O. SÃ¥ en algoritm kan sÃ¤gas kÃ¶ra i O n eller O av n kvadrat. Och mer om vad de innebÃ¤r i en sekund. 

Men ibland gÃ¶r vi vÃ¥rd om det bÃ¤sta scenariot. Om uppgifterna Ã¤r allt vi ville det ska vara och det var absolut perfekt och vi skickar denna perfekt datauppsÃ¤ttning genom vÃ¥r algoritm. Hur skulle det handtag i en sÃ¥dan situation? Vi hÃ¤nvisar ibland till det som big-Omega, sÃ¥ till skillnad frÃ¥n big-O, Vi har big-Omega. Big-Omega fÃ¶r bÃ¤sta scenariot. Big-O fÃ¶r det vÃ¤rsta scenariot. Generellt nÃ¤r vi talar om komplexiteten av en algoritm, vi pratar om i vÃ¤rsta fall. SÃ¥ ha det i Ã¥tanke. 

Och i denna klass, vi generellt gÃ¥ att lÃ¤mna noggrann analys Ã¥t sidan. Det finns vetenskaper och fÃ¤lt Ã¤gnas Ã¥t den hÃ¤r typen av grejer. NÃ¤r vi talar om resonemang genom algoritmer, som vi kommer att gÃ¶ra bit-fÃ¶r-bit fÃ¶r mÃ¥nga algoritmer vi talar om i klassen. Vi egentligen bara talar om resonemang igenom det med sunt fÃ¶rnuft, inte med formler, eller bevis, eller nÃ¥t sÃ¥nt. SÃ¥ oroa dig inte, vi kommer inte att fÃ¶rvandlas till en stor matte klass. 

SÃ¥ jag sa att vi bryr oss om komplexitet eftersom det stÃ¤ller frÃ¥gan, hur gÃ¶r vÃ¥ra algoritmer hanterar stÃ¶rre och stÃ¶rre datamÃ¤ngder som kastas pÃ¥ dem. NÃ¥, vad Ã¤r en datamÃ¤ngd? Vad jag menar nÃ¤r jag sa det? Det betyder vad gÃ¶r mest mening i sitt sammanhang, fÃ¶r att vara Ã¤rlig. Om vi ââhar en algoritm, den Processer Strings-- vi fÃ¶rmodligen talar om storleken pÃ¥ strÃ¤ngen. Det Ã¤r data set-- storleken, antalet tecken som utgÃ¶r strÃ¤ngen. Om vi ââpratar om en algoritm som behandlar filer, vi kan tala om hur mÃ¥nga kilobyte omfattar den filen. Och det Ã¤r datamÃ¤ngden. Om vi ââpratar om en algoritm som hanterar arrayer mer generellt, sÃ¥som sorteringsalgoritmer eller sÃ¶kalgoritmer, vi fÃ¶rmodligen pratar om antalet element som utgÃ¶r en array. 

Nu kan vi mÃ¤ta en algorithm-- sÃ¤rskilt nÃ¤r jag sÃ¤ger att vi kan mÃ¤ta en algoritm, jag menar vi kan mÃ¤ta hur mÃ¥nga resurser det tar upp. Huruvida dessa resurser Ã¤r, hur mÃ¥nga bytes RAM-- eller megabyte RAM-minne den anvÃ¤nder. Eller hur mycket tid det tar att kÃ¶ra. Och vi kan kalla detta mÃ¤ta, godtyckligt, f n. DÃ¤r n Ã¤r antalet element i datamÃ¤ngden. Och f n Ã¤r hur mÃ¥nga things. Hur mÃ¥nga enheter av resurser gÃ¶r det behÃ¶ver fÃ¶r att behandla dessa uppgifter. 

Nu, vi faktiskt inte bryr vad f n Ã¤r exakt. I sjÃ¤lva verket mycket sÃ¤llan will-- vi sÃ¤kert kommer aldrig i denna class-- jag dyka in i nÃ¥gon riktigt djup analys av vad f hos n Ã¤r. Vi ska bara tala om vad f frÃ¥n n Ã¤r ungefÃ¤r eller vad det tenderar att. Och tendensen av en algoritm Ã¤r dikteras av sin hÃ¶gsta ordningens term. Och vi kan se vad jag menar med detta genom att ta En titt pÃ¥ en mer konkret exempel. 

SÃ¥ lÃ¥t oss sÃ¤ga att vi har tre olika algoritmer. Den fÃ¶rsta som tar n kubik, vissa enheter av resurser att behandla en datauppsÃ¤ttning av storlek n. Vi har en andra algoritm som tar n kubik plus n kvadrerade resurser att behandla en datauppsÃ¤ttning av storlek n. Och vi har en tredje algoritm som kÃ¶rs in-- att tar upp n kubik minus 8n kvadrat plus 20 n enheter av resurser att behandla en algoritm med uppgifter som storlek n. 

Nu igen, vi verkligen inte kommer att komma in i denna detaljnivÃ¥. Jag Ã¤r verkligen bara har dessa upp hÃ¤r som en illustration av en punkt att jag kommer att vara vilket i ett andra, som Ã¤r att vi bara verkligen bryr om tendensen hos saker som datamÃ¤ngderna blir stÃ¶rre. SÃ¥ om datamÃ¤ngden Ã¤r liten, det finns faktiskt en ganska stor skillnad i dessa algoritmer. Den tredje algoritmen dÃ¤r tar 13 gÃ¥nger lÃ¤ngre, 13 gÃ¥nger sÃ¥ mycket resurser att kÃ¶ra i fÃ¶rhÃ¥llande till den fÃ¶rsta. 

Om vÃ¥r datamÃ¤ngden Ã¤r storlek 10, som Ã¤r stÃ¶rre, men inte nÃ¶dvÃ¤ndigtvis stora, Vi kan se att det finns faktiskt lite av en skillnad. Den tredje algoritmen blir mer effektiv. Det handlar om faktiskt 40% - eller 60% effektivare. Det tar 40% av mÃ¤ngden tid. Det kan run-- det kan ta 400 enheter av resurser att behandla en datauppsÃ¤ttning av storlek 10. Medan den fÃ¶rsta algoritm, dÃ¤remot, tar 1.000 enheter av resurser att behandla en datauppsÃ¤ttning av storlek 10. Men titta vad som hÃ¤nder nÃ¤r vÃ¥ra siffror bli Ã¤nnu stÃ¶rre. 

Nu, skillnaden mellan dessa algoritmer bÃ¶rjar bli lite mindre uppenbar. Och det faktum att det finns lÃ¤gre ordningens terms-- eller snarare, termer med lÃ¤gre exponents-- bÃ¶rjar bli irrelevant. Om en datauppsÃ¤ttning Ã¤r av storlek 1000 och den fÃ¶rsta algoritmen kÃ¶rs i en miljard steg. Och den andra algoritmen kÃ¶rs i en miljard och en miljon steg. Och den tredje algoritmen kÃ¶rs pÃ¥ bara blyg av en miljard steg. Det Ã¤r ganska mycket en miljard steg. De lÃ¤gre ordningens termer bÃ¶rjar att bli riktigt irrelevant. Och bara fÃ¶r att verkligen hammare hem point-- om dataingÃ¥ngen Ã¤r av storlek en million-- alla tre av dessa ganska mycket ta en quintillion-- om min matte Ã¤r correct-- steg att bearbeta en dataingÃ¥ng storlek en miljon. Det Ã¤r en mÃ¤ngd Ã¥tgÃ¤rder. Och det faktum att en av dem kanske ta ett par 100000, eller ett par 100 miljoner Ã¤nnu mindre nÃ¤r Vi pratar om ett antal som big-- det Ã¤r ganska irrelevant. De tenderar alla att ta approximativt n kubik, och sÃ¥ skulle vi faktiskt hÃ¤nvisar till alla dessa algoritmer som i storleksordningen n kubik eller big-O n i kubik. 

HÃ¤r Ã¤r en lista Ã¶ver nÃ¥gra av de mer gemensamma berÃ¤kningskomplexitetsklasser att vi kommer att stÃ¶ta in algoritmer, i allmÃ¤nhet. Och Ã¤ven specifikt i CS50. Dessa bestÃ¤lls frÃ¥n allmÃ¤nhet snabbast pÃ¥ toppen, allmÃ¤nt lÃ¥ngsammaste i botten. SÃ¥ konstant tids algoritmer tenderar att vara den snabbaste, oavsett av storleken pÃ¥ den inmatning av data du skickar in. De tar alltid en operation eller en enhet av resurser fÃ¶r att ta itu med. Det kan vara tvÃ¥, kanske det vara 3, kan det vara 4. Men det Ã¤r ett konstant antal. Det varierar inte. 

Logaritmisk tidsalgoritmer Ã¤r nÃ¥got bÃ¤ttre. Och en riktigt bra exempel pÃ¥ en logaritmisk tidsalgoritm Du har sÃ¤kert sett vid det hÃ¤r laget Ã¤r det isÃ¤rrivning av telefonboken att hitta Mike Smith i telefonboken. Vi skÃ¤r problemet i hÃ¤lften. Och sÃ¥ n blir stÃ¶rre och stÃ¶rre och larger-- i sjÃ¤lva verket varje gÃ¥ng du dubbla n tar det bara ett steg. SÃ¥ det Ã¤r en mycket bÃ¤ttre Ã¤n, sÃ¤g, linjÃ¤r tid. Vilket Ã¤r om du dubbla n, det tar dubbelt sÃ¥ mÃ¥nga steg. Om du tredubbla n tar det tredubbla antalet steg. Ett steg per enhet. 

DÃ¥ det blir lite more-- lite mindre bra dÃ¤rifrÃ¥n. Du har linjÃ¤r rytmisk tid, ibland kallas log linjÃ¤r tid eller bara n log n. Och vi ska ett exempel av en algoritm som kÃ¶rningar i n log n, som fortfarande Ã¤r bÃ¤ttre Ã¤n kvadratisk time-- n kvadrat. Eller polynomtid, n tvÃ¥ valfritt antal stÃ¶rre Ã¤n tvÃ¥. Eller exponentiell tid, vilket Ã¤r Ã¤ven worse-- C till n. SÃ¥ nÃ¥gra konstant antal hÃ¶jas till kraften i storleken av insignalen. SÃ¥ om det finns 1,000-- om dataingÃ¥ng Ã¤r av storlek 1000, det skulle ta C till Ã¥ter 1000:e kraften. Det Ã¤r mycket vÃ¤rre Ã¤n polynomisk tid. 

Faktoriell tid Ã¤r Ã¤nnu vÃ¤rre. Och faktiskt, det verkligen gÃ¶r Det finns oÃ¤ndliga tids algoritmer, sÃ¥som, s.k. dum sort-- vars jobb Ã¤r att slumpmÃ¤ssigt blanda en array och sedan kontrollera oavsett om det Ã¤r fÃ¶r sortering. Och om det inte Ã¤r slumpmÃ¤ssigt shuffle arrayen igen och kontrollera om det sorteras. Och som ni kan nog imagine-- du kan fÃ¶restÃ¤lla sig en situation var i vÃ¤rsta fall kommer att aldrig faktiskt bÃ¶rjar med matrisen. Denna algoritm skulle kÃ¶ra alltid. Och sÃ¥ det skulle vara en oÃ¤ndlig tid algoritm. FÃ¶rhoppningsvis kommer du inte att skriva varje fakultet eller oÃ¤ndlig tid algoritmer i CS50. 

SÃ¥, lÃ¥t oss ta en lite mer betong titt pÃ¥ nÃ¥gra enklare berÃ¤kningskomplexitetsklasser. SÃ¥ vi har en example-- eller tvÃ¥ exempel hÃ¤r-- av konstanta tidsalgoritmer, som alltid tar en enda operation i vÃ¤rsta fall. SÃ¥ den fÃ¶rsta example-- vi har en funktion kallade 4 fÃ¶r dig, som tar en rad storlek 1000. Men sedan tydligen inte faktiskt ser pÃ¥ det-- egentligen inte bryr sig vad som Ã¤r insidan av det, i nÃ¤mnda matris. Alltid bara returnerar fyra. SÃ¥ att algoritmen, trots det faktum att det tar 1000 element inte gÃ¶ra nÃ¥got med dem. Bara tillbaka fyra. Det Ã¤r alltid ett enda steg. 

I sjÃ¤lva verket, tillsÃ¤tt 2 nums-- som vi har sett tidigare som well-- bara behandlar tvÃ¥ heltal. Det Ã¤r inte ett enda steg. Det Ã¤r faktiskt ett par steg. Du fÃ¥r en fÃ¥r du b, du lÃ¤gga till dem tillsammans, och du matar ut resultaten. SÃ¥ det Ã¤r 84 steg. Men det Ã¤r alltid konstant, oavsett a eller b. Du mÃ¥ste fÃ¥ en, fÃ¥ b, lÃ¤gg ihop dem, mata ut resultatet. SÃ¥ det Ã¤r en konstant tidsalgoritm. 

HÃ¤r Ã¤r ett exempel pÃ¥ en linjÃ¤r tids algorithm-- en algoritm som gets-- som tar ett ytterligare steg, eventuellt, som din input vÃ¤xer med 1. SÃ¥, lÃ¥t oss sÃ¤ga att vi letar efter antalet 5 insidan av en matris. Du kanske har en situation dÃ¤r du kan finna det ganska tidigt. Men du kan ocksÃ¥ ha en situation dÃ¤r det kan vara det sista elementet i uppsÃ¤ttningen. I en matris med storleken 5, om Vi letar efter nummer 5. Det skulle ta 5 steg. Och faktiskt, fÃ¶restÃ¤lla sig att det finns inte 5 nÃ¥gonstans i denna uppsÃ¤ttning. Vi har fortfarande faktiskt mÃ¥ste titta pÃ¥ varje enskilt element i matrisen i syfte att faststÃ¤lla huruvida 5 Ã¤r dÃ¤r. 

SÃ¥ i vÃ¤rsta fall, vilket Ã¤r att elementet Ã¤r sist i gruppen eller inte existerar alls. Vi mÃ¥ste fortfarande titta pÃ¥ alla av n element. Och sÃ¥ denna algoritm kÃ¶rs i linjÃ¤r tid. Du kan bekrÃ¤fta detta genom att extrapolera lite genom att sÃ¤ga, om vi hade en 6-elementgrupp och Vi letade efter nummer 5, det kan ta 6 steg. Om vi ââhar en 7-elementgrupp och Vi letar efter nummer 5. Det kan ta 7 steg. Som vi lÃ¤gga till ytterligare en faktor till vÃ¥r array, tar det ett steg. Det Ã¤r en linjÃ¤r algoritm i vÃ¤rsta fall. 

Par snabba frÃ¥gor till dig. Vad Ã¤r runtime-- vad vÃ¤rsta fall runtime av denna speciella kodstrÃ¤ng? SÃ¥ jag har en 4 slinga hÃ¤r som kÃ¶rs frÃ¥n j Ã¤r lika med 0, hela vÃ¤gen upp till m. Och vad jag ser hÃ¤r, Ã¤r att kropp av slingan kÃ¶rs i konstant tid. SÃ¥ anvÃ¤nder den terminologi som Vi har redan talat about-- vad skulle vara det vÃ¤rsta runtime av denna algoritm? Ta en andra. Den inre delen av slingan kÃ¶rs i konstant tid. Och den yttre delen av den slinga kommer att kÃ¶ra m gÃ¥nger. SÃ¥ vad Ã¤r det vÃ¤rsta fall runtime hÃ¤r? Har du gissa big-O m? Du skulle bli rÃ¤tt. 

Vad sÃ¤gs om en annan? Den hÃ¤r gÃ¥ngen har vi en slinga i en slinga. Vi har en yttre slinga som gÃ¥r frÃ¥n noll till sid. Och vi har en inre slinga som lÃ¶per frÃ¥n noll till p, och insidan av det, Jag konstatera att kroppen slinga kÃ¶rs i konstant tid. SÃ¥ vad Ã¤r det vÃ¤rsta fall runtime av denna speciella kodstrÃ¤ng? Tja, Ã¥terigen, har vi en yttre slinga som lÃ¶per p gÃ¥nger. Och varje time-- iteration av denna slinga, snarare. Vi har en inre slinga som kÃ¶rs ocksÃ¥ p gÃ¥nger. Och sedan inne i det, det Ã¤r konstant time-- lilla utdrag dÃ¤r. 

SÃ¥ om vi har en yttre slinga som kÃ¶rs p tider inuti vilket Ã¤r en inre Ã¶gla som lÃ¶per p times-- vad som Ã¤r vÃ¤rsta fall runtime av detta utdrag av koden? Har du gissa big-O p kvadrat? 

Jag Ã¤r Doug Lloyd. Detta Ã¤r CS50.