TrÃ¨s bien, alors, la complexitÃ© de calcul. Juste un peu d'un avertissement Avant de nous plonger dans de trop far-- ce sera probablement parmi les les choses les plus de maths-lourd nous parlons dans CS50. EspÃ©rons que ce ne sera pas trop Ã©crasante et nous allons essayer de vous guider dans le processus, mais juste un peu d'un avertissement juste. Il ya un peu des mathÃ©matiques en cause ici. TrÃ¨s bien, alors, afin de faire utilisation de nos ressources informatiques dans le rÃ©el monde-- il est vraiment important de comprendre les algorithmes et comment ils traitent les donnÃ©es. Si nous avons une trÃ¨s algorithme efficace, nous peut minimiser la quantitÃ© de ressources nous disposons pour traiter avec elle. Si nous avons un algorithme qui va prendre beaucoup de travail pour traiter un trÃ¨s vaste ensemble de donnÃ©es, il est va exiger plus et plus de ressources, ce qui est de l'argent, de la RAM, tout ce genre de trucs. 

Donc, Ãªtre capable d'analyser une algorithme utilisant cet ensemble d'outils, essentiellement, demande Ã  la question-- comment fonctionne cette Ã©chelle de l'algorithme comme on jette de plus en plus de donnÃ©es Ã  elle? Dans CS50, la quantitÃ© de donnÃ©es que nous sommes travailler avec est assez petite. GÃ©nÃ©ralement, nos programmes vont afin de fonctionner dans un deuxiÃ¨me ou less-- probablement beaucoup moins surtout au dÃ©but. 

Mais pensez Ã  une sociÃ©tÃ© qui traite avec des centaines de millions de clients. Et ils ont besoin pour traiter que les donnÃ©es de client. Comme le nombre de clients qu'ils avoir devient de plus en plus grande, il va exiger de plus en plus de ressources. Combien d'autres ressources? Eh bien, cela dÃ©pend de la faÃ§on dont nous analysons l'algorithme, utilisant les outils de cette boÃ®te Ã  outils. Lorsque nous parlons de la complexitÃ© de un algorithm-- qui, parfois, vous aurez entendre qu'elle a appelÃ© le temps la complexitÃ© ou de l'espace de la complexitÃ© mais nous allons juste appeler complexity-- nous sommes gÃ©nÃ©ralement parler le pire scÃ©nario. Compte tenu de la pire tas de les donnÃ©es que nous pourrions jeter Ã  elle, comment cet algorithme va traiter ou de traiter avec ces donnÃ©es? Nous appelons gÃ©nÃ©ralement le pire des cas l'exÃ©cution d'un grand-O de l'algorithme. Donc un algorithme peut Ãªtre dit courir dans O n ou O n carrÃ©. Et plus sur ce que ceux qui signifie dans une seconde. 

Parfois, cependant, nous ne nous soucions sur le meilleur scÃ©nario. Si les donnÃ©es sont tout ce que nous voulions que ce soit et il Ã©tait absolument parfait et nous avons envoyÃ© cette parfaite ensemble de donnÃ©es grÃ¢ce Ã  notre algorithme. Comment serait-il gÃ©rer dans cette situation? On se rÃ©fÃ¨re parfois Ã  ce que grand-Omega, donc en contraste avec Big-O, Nous avons de grands-Omega. Big-Omega pour le meilleur scÃ©nario. Big-O pour le pire des scÃ©narios. GÃ©nÃ©ralement, quand on parle de la complexitÃ© d'un algorithme, nous parlons de la le pire des cas. Alors garde cela en tÃªte. 

Et dans cette classe, nous sommes gÃ©nÃ©ralement aller de quitter l'analyse rigoureuse de cÃ´tÃ©. Il ya sciences et des champs consacrÃ© Ã  ce genre de choses. Lorsque nous parlons de raisonnement grÃ¢ce Ã  des algorithmes, que nous ferons morceau par morceau pour beaucoup algorithmes que nous parlons dans la classe. Nous sommes vraiment juste parler raisonnement avec le sens commun, pas avec des formules ou des preuves, ou quelque chose comme Ã§a. Donc, ne vous inquiÃ©tez pas, nous ne serons pas se transformer en une grande classe de mathÃ©matiques. 

Donc je l'ai dit nous nous soucions de la complexitÃ© car il pose la question, comment nos algorithmes ne traitent plus grand et de plus grands ensembles de donnÃ©es Ã©tant jetÃ©s sur eux. Eh bien, ce qui est un ensemble de donnÃ©es? Qu'est-ce que je veux dire quand je dis cela? Cela signifie que tout ce que fait le plus sens dans le contexte, pour Ãªtre honnÃªte. Si nous avons un algorithme, la Processus Strings-- Nous sommes probablement parler de la taille de la chaÃ®ne. VoilÃ  les donnÃ©es set-- la taille, le nombre des caractÃ¨res qui composent la chaÃ®ne. Si nous parlons d'une algorithme qui traite les fichiers, nous pourrions parler de la faÃ§on dont de nombreux kilo-octets comprennent ce fichier. Et qui est le jeu de donnÃ©es. Si nous parlons d'un algorithme qui gÃ¨re les tableaux, plus gÃ©nÃ©ralement, comme algorithmes de tri ou la recherche des algorithmes, nous parlons probablement sur le nombre des Ã©lÃ©ments qui composent un tableau. 

Maintenant, nous pouvons mesurer une algorithm-- en particulier, quand je dis que nous pouvons mesurer un algorithme, je dire que nous pouvons mesurer de nombreuses ressources qu'il prend. Si ces ressources sont, combien octets de RAM-- ou Mo de RAM il utilise. Ou combien de temps qu'il faut pour exÃ©cuter. Et nous pouvons appeler cela mesurer, arbitrairement, de f n. OÃ¹ n est le nombre de Ã©lÃ©ments de l'ensemble de donnÃ©es. Et f de n est le nombre de quadragÃ©naires. Combien d'unitÃ©s de ressources ne il exige de traiter ces donnÃ©es. 

Maintenant, nous ne nous soucions pas fait sur ce que f de n est exactement. En fait, nous will-- trÃ¨s rarement Certainement jamais dans ce que je class-- plonger dans quelle vraiment profonde analyse de ce f de n est. Nous allons juste parler de ce que f n est d'environ ou qui tend Ã . Et la tendance d'un algorithme est dictÃ© par son terme d'ordre le plus Ã©levÃ©. Et nous pouvons voir ce que je dire par lÃ  en prenant un oeil Ã  un exemple plus concret. 

Alors disons que nous avons trois algorithmes diffÃ©rents. Le premier d'entre eux prend n cubes, certaines unitÃ©s de ressources pour traiter un ensemble de donnÃ©es de taille n. Nous avons un deuxiÃ¨me algorithme qui prend n cubes ainsi que des ressources n carrÃ©s pour traiter un ensemble de donnÃ©es de taille n. Et nous avons un troisiÃ¨me algorithme qui exÃ©cute in-- que prend n moins cubes 8n carrÃ© plus 20 n unitÃ©s de ressources pour traiter un algorithme avec l'ensemble de taille n donnÃ©es. 

Maintenant, encore une fois, nous allons vraiment pas pour entrer dans ce niveau de dÃ©tail. Je suis vraiment ai juste ces up ici comme une illustration d'un point que je vais Ãªtre prise dans une seconde, qui est que nous nous soucions seulement vraiment Ã  propos de la tendance des choses que les ensembles de donnÃ©es deviennent plus grands. Donc, si l'ensemble de donnÃ©es est petite, il ya fait une trÃ¨s grande diffÃ©rence dans ces algorithmes. Le troisiÃ¨me algorithme y prend 13 fois plus longtemps, 13 fois la quantitÃ© de ressources Ã  courir par rapport Ã  la premiÃ¨re. 

Si notre ensemble de donnÃ©es est la taille 10, qui est plus grand, mais pas nÃ©cessairement Ã©norme, nous pouvons voir qu'il ya en fait un peu de diffÃ©rence. Le troisiÃ¨me algorithme devient plus efficace. Il est environ 40% en fait - ou 60% plus efficace. Il faut 40% du temps. Il peut run-- il peut prendre 400 unitÃ©s de ressources pour traiter un ensemble de donnÃ©es de taille 10. Alors que le premier algorithme, par contraste, prend 1.000 unitÃ©s de ressources pour traiter un ensemble de donnÃ©es de taille 10. Mais regardez ce qui se passe comme nos chiffres deviennent encore plus grand. 

Or, la diffÃ©rence entre ces algorithmes commencer Ã  devenir un peu moins apparente. Et le fait qu'il y a ordre infÃ©rieur terms-- ou plutÃ´t, termes avec exponents-- infÃ©rieure commencer Ã  devenir hors de propos. Si un ensemble de donnÃ©es est de taille 1000 et le premier algorithme fonctionne dans un milliards Ã©tapes. Et le deuxiÃ¨me algorithme fonctionne en un milliard et un million Ã©tapes. Et le troisiÃ¨me algorithme exÃ©cute dans un peu moins d'un milliard d'Ã©tapes. Il est Ã  peu prÃ¨s un milliard d'Ã©tapes. Ces termes d'ordre infÃ©rieur commencent pour devenir vraiment pertinent. Et juste pour vraiment marteler le point-- si l'entrÃ©e de donnÃ©es est une taille de million-- tous les trois de ces Ã  peu prÃ¨s prendre une quintillion-- si mes calculs sont Ã©tapes correct-- pour traiter une entrÃ©e de donnÃ©es de la taille d'un million. Cela fait beaucoup d'Ã©tapes. Et le fait que l'un d'eux pourrait prendre une couple de 100.000, ou un couple 100 encore moins quand millions nous parlons d'un certain nombre que big-- il est un peu hors de propos. Ils ont tous tendance Ã  prendre n cubes environ, et ainsi nous aurions effectivement reporter Ã  l'ensemble de ces algorithmes comme Ã©tant de l'ordre de n cubes ou Big-O de n cubes. 

Voici une liste de quelques-uns des plus classes de complexitÃ© de calcul communes que nous allons rencontrer dans algorithmes, en gÃ©nÃ©ral. Et aussi spÃ©cifiquement dans CS50. Ceux-ci sont commandÃ©s Ã  partir gÃ©nÃ©ralement plus rapide au sommet, gÃ©nÃ©ralement le plus lent Ã  en bas. Donc algorithmes de constante de temps ont tendance Ãªtre le plus rapide, quel que soit de la taille de la entrÃ©e de donnÃ©es vous passez. Ils prennent toujours une opÃ©ration ou une unitÃ© de ressources pour faire face Ã . Il pourrait Ãªtre 2, il pourrait Ãªtre trois, il peut Ãªtre 4. Mais il est un nombre constant. Il ne varie pas. 

Les algorithmes de temps logarithmique sont un peu mieux. Et un trÃ¨s bon exemple de un algorithme logarithmique vous avez sÃ»rement vu dÃ©sormais est la dÃ©chirer du livre de tÃ©lÃ©phone Ã  trouver Mike Smith dans le livre de tÃ©lÃ©phone. Nous avons rÃ©duit le problÃ¨me de moitiÃ©. Et de maniÃ¨re plus large n obtient et plus grande et larger-- En fait, chaque fois que vous double n, il prend seulement un pas de plus. VoilÃ  donc beaucoup mieux que, par exemple, le temps linÃ©aire. Qui est si vous doublez n, il prend le double du nombre d'Ã©tapes. Si vous triplez n, il faut tripler le nombre d'Ã©tapes. Une Ã©tape par unitÃ©. 

Puis les choses deviennent un peu plus-- peu moins grande Ã  partir de lÃ . Vous avez le temps rythmique linÃ©aire, parfois appelÃ© journal temps linÃ©aire ou tout simplement n log n. Et nous allons un exemple d'un algorithme qui points en n log n, ce qui est encore mieux time-- quadratique de n au carrÃ©. Ou polynomiale, deux n un nombre quelconque supÃ©rieur Ã  deux. Ou le temps exponentielle, ce qui est encore worse-- C au n. Ainsi, certains nombre constant portÃ© Ã  la puissance de la taille de l'entrÃ©e. Donc, si il ya 1,000-- si le entrÃ©e de donnÃ©es est de taille 1000, il faudrait C Ã  la puissance 1000 e. Il est bien pire que le temps polynomiale. 

Temps factorielle est encore pire. Et en fait, il ne sont pas vraiment Il existe des algorithmes de temps infini, tels que, soi-disant sort-- stupide dont travail consiste Ã  mÃ©langer de faÃ§on alÃ©atoire un tableau puis vÃ©rifier si elle est triÃ©e. Et si elle est pas, au hasard mÃ©langez Ã  nouveau le tableau et vÃ©rifier pour voir si elle est triÃ©e. Et comme vous pouvez probablement imagine-- vous pouvez imaginer une situation oÃ¹, dans le pire des cas, que la volontÃ© jamais rÃ©ellement commencer avec le tableau. Cet algorithme courrait toujours. Et ce serait une algorithme de temps infini. EspÃ©rons que vous ne serez pas Ã©crivez tout moment factoriel ou infini algorithmes dans CS50. 

Donc, nous allons prendre un peu plus regard concret sur certains simple classes de complexitÃ© de calcul. Nous avons donc une example-- ou deux exemples ici-- des algorithmes de constante de temps, qui prennent toujours une seule opÃ©ration dans le pire des cas. Donc la premiÃ¨re example-- nous avons une fonction appelÃ© 4 pour vous, qui prend un tableau de taille de 1000. Mais alors, semble-t- ne fait pas regarder au it-- ne se soucie pas vraiment ce qui est Ã  l'intÃ©rieur, de ladite matrice. Toujours retourne juste quatre. Ainsi, cet algorithme, malgrÃ© le fait qu'il prend 1.000 Ã©lÃ©ments n'a pas faire quelque chose avec eux. Retourne juste quatre. Il est toujours une seule Ã©tape. 

En fait, ajouter 2 qui nums-- nous avons vu auparavant que well-- processus juste deux entiers. Il est pas une seule Ã©tape. Il est en fait un couple d'Ã©tapes. Vous obtenez un, vous obtenez b, vous les ajoutez ensemble, et sortie des rÃ©sultats. Donc, il est 84 Ã©tapes. Mais il est toujours constante, indÃ©pendamment de a ou b. Vous devez obtenir un, obtenez b, ajouter ensemble, sortie du rÃ©sultat. VoilÃ  donc un algorithme de temps constant. 

Voici un exemple d'un linÃ©aire algorithm-- de temps un algorithme qui gets-- qui prend une Ã©tape supplÃ©mentaire, le cas Ã©chÃ©ant, que votre entrÃ©e augmente de 1. Donc, disons que nous recherchons le nombre 5 Ã  l'intÃ©rieur d'un tableau. Vous pourriez avoir une situation oÃ¹ vous pouvez le trouver assez tÃ´t. Mais vous pourriez aussi avoir une situation oÃ¹ il pourrait Ãªtre le dernier Ã©lÃ©ment du tableau. Dans un tableau de taille 5, si nous recherchons pour le numÃ©ro 5. Il faudrait 5 Ã©tapes. Et en fait, imaginez qu'il ya pas 5 partout dans ce tableau. En fait, nous avons encore Ã  regarder chaque Ã©lÃ©ment du tableau afin de dÃ©terminer si oui ou non il est 5. 

Donc, dans le pire des cas, ce qui est ce que l'Ã©lÃ©ment est la derniÃ¨re dans le tableau ou ne existe pas du tout. Nous avons encore Ã  regarder tous les n Ã©lÃ©ments. Et si cet algorithme fonctionne en temps linÃ©aire. Vous pouvez confirmer que par extrapolant un peu en disant, si nous avions un tableau 6-Ã©lÃ©ment et nous Ã©tions Ã  la recherche pour le numÃ©ro 5, il pourrait prendre 6 Ã©tapes. Si nous avons un ensemble de 7 Ã©lÃ©ments et nous recherchons pour le numÃ©ro 5. Il pourrait prendre 7 Ã©tapes. Comme nous ajoutons un Ã©lÃ©ment de plus Ã  notre tableau, il prend un pas de plus. VoilÃ  un algorithme linÃ©aire dans le pire des cas. 

Couple de questions pour vous. Quelle est la runtime-- ce qui est le pire des cas d'exÃ©cution de ce bout de code particulier? Je dois donc une boucle de 4 ici qui fonctionne De J est Ã©gal Ã  0, tout le chemin jusqu'Ã  m. Et ce que je vois ici, est que le corps de la boucle fonctionne en temps constant. Donc, en utilisant la terminologie nous avons dÃ©jÃ  parlÃ© ce about-- serait le pire des cas exÃ©cution de cet algorithme? Prenez une seconde. La partie interne de la boucle fonctionne en temps constant. Et la partie extÃ©rieure de la boucle va courir m fois. Alors, quel est le pire des cas runtime ici? Avez-vous devinÃ© Big-O de m? Vous avez raison. 

Que diriez-vous les uns les autres? Cette fois, nous avons une boucle Ã  l'intÃ©rieur d'une boucle. Nous avons une boucle externe qui va de zÃ©ro Ã  p. Et nous avons une boucle interne qui fonctionne de zÃ©ro Ã  p, et Ã  l'intÃ©rieur de cela, Je dÃ©clare que le corps de la boucle fonctionne en temps constant. Alors, quel est le pire des cas d'exÃ©cution de ce bout de code particulier? Eh bien, encore une fois, nous avons une boucle externe qui exÃ©cute p fois. Et chaque itÃ©ration time-- de cette boucle, plutÃ´t. Nous avons une boucle intÃ©rieure qui fonctionne aussi p fois. Et puis Ã  l'intÃ©rieur de cela, il ya la constante petit extrait time-- il. 

Donc, si nous avons une boucle externe qui exÃ©cute p fois intÃ©rieur de ce qui est une boucle intÃ©rieure qui p exÃ©cute ce qui est times-- le pire des cas d'exÃ©cution de ce bout de code? Avez-vous devinÃ© Big-O de p carrÃ©? 

Je suis Doug Lloyd. Ceci est CS50.