본문 바로가기

Stay Hungry Stay Foolish121

웹 크롤링) Selenium VS BeautifulSoup 라이브러리 비교 크롤링에는 대표적으로 두 가지 라이브러리를 사용한다. 차이를 알아보자. Selenium BeautifulSoup 웹 동작 html 정보 파싱 동적 크롤링을 효과적으로 수행 라이브러리 자체가 무겁고, 자주 막힌다 Requests와 BeatutifulSoup으로 최대한 해결하기 페이지 html 정보 가져오기 driver.page_source 웹동작시 driver.find_element_by_xpath('복사한 xpath') (.click(), .send_keys() 등) 스크립트 실행시 driver.execute_script('원하는 명령어') URL이나 xpath를 활용하는 경우에는 규칙을 찾아서 만들어두는 것이 작업 속도를 훨씬 높여준다. soup = BeautifulSoup(html,'lxml') so.. 2021. 2. 10.
웹 크롤링) BeautifulSoup으로 네이버 실시간검색어 크롤링하기 0. 들어가기전, 개념 소개 및 설치 웹 크롤링? 웹 상에 있는 원하는 정보를 수집 -> 스스로 데이터베이스 구축 가능 !!! BeautifulSoup 소스코드를 파싱하는 데 사용하는 라이브러리 BeautifulSoup은 html에서 원하는 정보를 빠르게 찾을 수 있다. ! pip install beatifulsoup4 form bs4 import BeautifulSoup BeautifulSoup 설치 후 requests 설치 url을 주면 html을 가지고 오는 모듈(urllib & requests) ! pip install requests import requests + Selenium 과 BeautifulSoup 라이브러리 정리해뒀습니다. https://rladuddms.tistory.com/64?.. 2021. 2. 10.
Python 프로그래밍 기초 정리 0. Python 프로그래밍 기초_자료형 = 대입연산자 == 비교연산자 # comment(주석) print(a,b,sep='*',end='!!') : sep : 구분자. end : 마지막에 출력할 문자열 variable naming(변수 이름 규칙) : reserved keywords(예약어) 사용불가. 영문 대소문자, _ 가능 1. 기본 데이터 타입 type(변수) 정수(int) 실수(float) 문자열(str) 불리언(boolean) None comparison operator (비교 연산자) : =,!=,= -> 결과 bool 타입 numbers (숫자형 타입) : 정수, 실수, 연산자 우선순위(기본적인 수학 연산자와 동일) 2. string (문자열) '',"", ''' '''(여러줄) escap.. 2021. 2. 10.
Decision Tree 결정트리 나무구조로 도표화하여 분류/예측을 수행하는 머신러인 알고리즘 (지도학습) 개념/코드가 잘 정리되어있는 글이 있어 첨부합니다. analysis-flood.tistory.com/100 43. Python - 결정 트리(Decision Tree) 자. 오늘은 새로운 챕터, 결정 트리입니다. SVM처럼 결정 트리(Decision tree)는 분류와 회귀 작업 그리고 다중출력 작업도 가능한 다재다능한 머신러닝 알고리즘입니다. 또한, 매우 복잡한 데이터셋 analysis-flood.tistory.com scikit-learn.org/stable/modules/tree.html 1.10. Decision Trees — scikit-learn 0.24.1 documentation 1.10. Decision Trees .. 2021. 2. 3.
티스토리 스킨 편집 html/CSS 2021년을 맞아,, 새롭게 티스토리를 편집했다. 꽤 오래하다보니 티스토리에 좀 더 애정을 갖게 되어서 오랜만에 이쁘게 새단장을 했다. 난 이웃목록을 사이드바에 넣고싶었다. 티스토리는 사이드바에서 기본적으로 이웃 목록을 지원하지 않는다. 티스토리는 이런 면에서는 네이버 블로그보다 별로인 점도 있는 것 같다. 그래도 구글링으로는 궁금증이 거의 해결된다 ㅎㅎ 구글링으로 알게된 내용을 정리하려고한다. 보이는 것보다 훨씬 쉽고 간편하다. html/CSS도 보다보면 규칙이 보일 것이다. 많이 사용할 것 같다 !!! 내가 지정한 스킨은 Book Club이다! 1. '관리'-'나의 링크'에 내 티스토리 이웃 링크를 지정한다. 2. 사이드바에 링크를 추가하기 위해 스킨 html을 편집한다. 그냥 이웃을 추가했다가 다 .. 2021. 2. 2.
[밑바닥부터 시작하는 딥러닝] 4장 신경망 학습 제가 발표했던 자료 및 설명 공유합니다. "밑바닥부터 시작하는 딥러닝" 책의 4장 신경망 학습 내용입니다. 학습 : 훈련 데이터로부터 가중치 매개변수의 최적값을 자동으로 획득하는 것 신경망이 학습할 수 있도록 해주는 지표인 손실 함수를 알아보자 !! 이 손실 함수의 결과값을 가장 작게 만드는 가중치 매개변수를 찾는 것이 학습 목표 손실함수의 값을 가급적 작게 만드는 기법으로 함수의 기울기를 활용하는 경사법 소개 ~ 신경망의 특징 : 데이터를 보고 학습할 수 있다는 점. 매개변수의 값을 데이터를 보고 자동으로 결정한다. 알고리즘을 밑바닥부터 설계하는 것 대신 주어진 데이터를 잘 활용해서 해결한다. 이미지에서 특징feature(입력 이미지에서 중요 데이터를 정확하게 추출할 수 있도록 설계된 변환기) 추출 -.. 2021. 2. 1.
Github / Git 입문하기 0. GIT Repositories 생성 1. github 새 폴더 생성후 git bash here로 git 접속하기 2. git init .git 폴더 자동생성 3. git remote add origin 레포지토리주소 예) git remote add origin github.com/yyeongeun/Coursera.git 원격 저장소 정보 추가. 4. .git 폴더 안에 추가하고싶은 파일 생성 5. git status 새 파일있는지 확인 6. git add . 전체 파일 추가 7. git commit -m "커밋명" 예) git commit -m "coursera 2weeks" 커밋 지정 인덱스에 추가된 파일의 내용을 저장소에 쓸 때. + 커밋 히스토리 확인하기 git log 8. git push o.. 2021. 2. 1.
[Coursera Deep Learning] Neural Networks and Deep Learning 강의 추천 코세라 DL 강의 추천합니다! 강의 outline 및 중요한 부분을 정리했습니다. I find it really satisfying when I learn about algorithm and they get it coded up and I see it worked for myself. So I hope you enjoy that too. Outline of this Course Week 1 : Introduction Week 2 : Basics of Neural Network programming Week 3 : One hidden layer Neural Networks Week 4 : Deep Neural Networks coursera.org/share/c4aeb004a5233df59080aa893b.. 2021. 1. 26.
[밑바닥부터 시작하는 딥러닝] 정리 링크 공유 파이썬으로 익히는 딥러닝 이론 및 구현을 다루는 가장 유명한 책인 [밑바닥부터 시작하는 딥러닝] 내용 및 코드 정리된 링크 공유합니다. https://sdr1982.tistory.com/201 '밑바닥부터 시작하는 딥러닝' jupyter notebook 정리 노트. '밑바닥부터 시작하는 딥러닝' 책 스터디 한 내용 정리해서 jupyter notebook 으로 올립니다 Github주소 : https://github.com/SDRLurker/deep-learning jupyter notebook 주소 : http://nbviewer.jupyter.org/g.. sdr1982.tistory.com 1장 헬로 파이썬 1.1 파이썬이란? 1.2 파이썬 설치하기 __1.2.1 파이썬 버전 __1.2.2 사용하는 외.. 2021. 1. 24.
[논문 정리] ArcFace: Additive Angular Margin Loss for Deep Face Recognition 얼굴 인식 관련 논문이다! 얼굴 인식에 대한 매우 분별력 있는 Features를 얻기 위한 Additive Angular Margin Loss(ArcFace)에 대해 알아보자. 직접 논문정리를 하려고 했으나, 이미 잘 정리된 곳이 있어 불러왔다. ABSTRACT를 간단하게 읽고 읽는 것을 추천한다. ArcFace: Additive Angular Margin Loss for Deep Face Recognition Abstract One of the main challenges in feature learning using Deep Convolutional Neural Networks (DCNNs) for largescale face recognition is the design of appropriate .. 2020. 12. 15.