处理复杂的HTML嵌套结构,提取电影信息。
处理嵌套结构时,可以逐层定位:
movies = soup.find_all('div', class_='movie-card')
for movie in movies:
title = movie.find('h3', class_='movie-title').text
director = movie.find('span', class_='director').text
year = movie.find('span', class_='year').text
rating = movie.find('span', class_='rating').text
应该提取到 5 部电影的完整信息
每部电影包含:片名、导演、年份、评分、类型