Passer au contenu principal

Tuto de scrapping web

 import requests # J'appelle ici la bibliotheque requests pour faire des requetes html

from bs4 import BeautifulSoup # ici beautifulsoup pour parcourir et rechercher des balise html
entrer = 0 # un simple compteur pour savoir ou on en est dans les pages downloader
for nb in range(1, 21): # Je parcours avec la bouble range les pages 20 pages, le 21 n'est pas compris
    # la variable nb sert de numero de page
    # on afecte a url le lien avec la variable pour le numero de page
    url = f"https://www.autoscout24.fr/lst?atype=C&cy=F&desc=0&page={nb}&search_id=ygqajqpcvt&sort=standard&source=listpage_pagination&ustate=N%2CU"

    # Le code 200 veut dire que la connexion a reussi il y a plein d'autre code possible comme le fameux code 404 page not found.
    page = requests.get(url) #on place les donneees de la requete dans une variable page.

    if page.status_code == 200: # si le status_code de la requetes est 200 on execute le code.
        soup = BeautifulSoup(page.content, 'html.parser') # On parse la page qui sert a mettre en forme pour y faire des recherche par balise
        titles = soup.find_all('h2') # on va chercher toute les balise h2 ou le titre du vehicules se trouvais avec
        # find_all qui cherche toute les referrence de h2 il y a find aussi qui peut envoyer le premier element de la page.

        # On cherche maintenant les balise p avec les class 'Price_price__APlgs PriceAndSeals_current_price__ykUpx'
        # encore une fois avec find_all pour toute les repere. remarquer qu<on utilise beautifulsoup avec la variable soup dou l'on la affecter
        prices = soup.find_all('p', class_='Price_price__APlgs PriceAndSeals_current_price__ykUpx')
        # on ouvre un fichier data.text en monde ajout "a" remarquez qu<il y a d<autre option a open comme "r" pour en lecture seul
        # "w" pour en mode ecriture mais qui effache les entrer precedante. etc...
        # on entre aussi un encodage utf-8
        with open('data2.txt', 'a', encoding='utf-8') as data:
            # on parcours les balise h2 dans la liste titles creer precedament
            for h2 in titles:
                # on cherche les balise span la balise h2 pour oter ce qui n<est pas la marque de la voiture
                span = h2.find('span')
                # si on trouve un span
                if span:
                    span.decompose()
            # on ecrit les donnees dans un fichier texte, zip sert a faire plusieur iteneraire en meme temps
            for h2, price in zip(titles, prices):
                data.write(f"Title: {h2.get_text(strip=True)}\n")
                data.write(f"Price: {price.get_text(strip=True)}\n")
                data.write("\n")  # Ajouter une ligne vide entre chaque entrée
                entrer += 1
                print(entrer)

       

       

Commentaires

Messages les plus consultés de ce blogue

La règle des 72 en finance

La règle des 72 sert à déterminer approximativement en combien de temps une somme d’argent quelconque atteindra le double de sa valeur avec un taux d’intérêt donné. Par exemple , pour savoir en combien d’années un montant doublera sa valeur, on prend 72 et on le divise par le taux d’intérêt. Si on a un taux d’intérêt de 1,3 %, on fait 72/1,3, ce qui équivaut à environ 55. Ainsi, pour que 5000 dollars doublent pour atteindre 10 000 dollars à un taux d’intérêt de 1,3 %, cela prendrait 55 ans. On peut aussi diviser le nombre d’années par 72 pour trouver le taux d’intérêt qui permettrait de doubler le montant, comme ceci : 72/55 ans est égal à environ 1,3 %. Ce raccourci provient de la formule n = log ⁡ ( 2 ) log ⁡ ( 1 + r )  où : r  est le taux d’intérêt annuel, n  est le nombre d’années nécessaires pour doubler le montant avec des intérêts composés. C'est très utilisé en finance parce que c'èst facile à compter et simple .

Comprendre la Valeur Temporelle de l'Argent : Les Fondements Mathématiques du TVM

Il existe deux grandes formules utilisées pour la valeur temporelle de l’argent : l’intérêt simple et l’intérêt composé. 1. Intérêt simple Avec l’intérêt simple, les intérêts sont calculés uniquement sur le principal. La formule de la valeur future avec intérêt simple est : V F = P × ( 1 + r × n ) VF = P \times (1 + r \times n) P est le montant principal (la somme initiale), r est le taux d’intérêt (sous forme décimale, par exemple 5 % devient 0,05), n est le nombre de périodes. Pour la valeur actuelle avec intérêt simple, la formule est dérivée ainsi : V A = V F 1 + r × n VA = \frac{VF}{1 + r \times n} 2. Intérêt composé L’intérêt composé est plus courant en finance, car il prend en compte les intérêts qui s’accumulent à chaque période. Les intérêts sont calculés non seulement sur le principal, mais aussi sur les intérêts accumulés. La formule de la valeur future avec intérêt composé est : V F = P × ( 1 + r ) n VF = P \times (1 + r)^n r est le taux d’intérêt par période, n est le...

Une Partie d’Échecs Remplie de Tension : Veronedever contre Taken7979

Aujourd'hui, je vais vous présenter une partie d’échecs fascinante jouée sur Chess.com entre deux joueurs aux niveaux d’expérience très différents : Veronedever (678 Elo) et Taken7979 (1061 Elo). Cette partie, disputée du 15 au 20 septembre 2024, s’est soldée par une nulle après une série de coups répétitifs. Voici un aperçu de ce duel captivant. L’ouverture : une approche classique La partie débute par un 1. e4 e5 , une ouverture classique où les deux joueurs prennent rapidement possession du centre. Veronedever, jouant avec les pièces blanches, choisit ensuite de développer son cavalier avec 2. Nf3 . Taken7979 répond de manière symétrique avec Nc6 , et très vite, la partie s’oriente vers une ouverture italienne après le coup 3. Bc4 de Veronedever. Ce début est assez standard, permettant à chacun de mobiliser ses pièces tout en renforçant sa position centrale. Taken7979 réplique avec 4... Nf6 , attaquant le pion en e4 et accentuant la pression sur les Blancs. La tension monte dè...