mecab 설치
git clone https://github.com/SOMJANG/Mecab-ko-for-Google-Colab.git
cd Mecab-ko-for-Google-Colab
bash install_mecab-ko_on_colab190912.sh
KonLPy 설치
KonLPy은 POS태거인 twitter와 mecab을 가지고 있다.
pip install konlpy
설치 후
python3로 들어가서
>>> from konlpy.tag import Mecab
>>> mecab = Mecab()
>>> mecab.pos('이상하다 이상해 생각해도 어쩔 수 없어 변함')
[('이상', 'NNG'), ('하', 'XSV'), ('다', 'EC'), ('이상', 'NNG'),
('해', 'XSV+EC'), ('생각', 'NNG'), ('해도', 'XSV+EC'), ('어쩔', 'VV+ETM'),
('수', 'NNB'), ('없', 'VA'), ('어', 'EC'), ('변함', 'VV+ETN')]
※ 주의
AttributeError: module 'tweepy' has no attribute 'StreamListener' 에러 발생시
konlpy 패키지가 tweepy 패키지에 포하된 StreamListener 클래스를 불러오지 못한다는 의미로.
우선 tweepy패키지가 설치되어 있는지 확인한다,
import tweepy
print(tweepy.__version__)
>> 4.10.0
위와 같이 나오면 정상적으로 설치가 되어있는 것.
하지만, 4버전 부터는 Stream이란 클래스로 통합되어서 안되는 오류이다. (tweepy 버전을 낮춰보자)
pip3 install tweepy==3.10.0
이후 정상 작동 확인.
MAC크롤링 셋팅(pip, requests, beautifulsoup4) (0) | 2021.08.21 |
---|