情感分析初戰(zhàn)

from snownlp import SnowNLP
import pandas as pd
import numpy as np

traindata=pd.read_csv('/Users/xuyizhou/Desktop/trainData.csv')
  • 報錯:
    UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 8: inva
    subline查看文件亂碼,修改后不是亂碼

  • 報錯:
    ParserError: Error tokenizing data. C error: Expected 5 fields in line 17077, saw 7
    \r的錯


try another way

df=pd.read_xlsx('/Users/xuyizhou/Desktop/trainData.xlsx')

wrong

df=pd.read_excel('/Users/xuyizhou/Desktop/trainData.xlsx')

fundamental operation

df.head()
df.head(1)
df.dtypes
df.index
df.describe
df.iloc[3:5,1:4]

NLP
object->string

eg.

import json
data = [ { 'a':'A', 'b':(2, 4), 'c':3.0 } ]
data_string = json.dumps(data)
print 'ENCODED:', data_string
decoded = json.loads(data_string)
print 'DECODED:', decoded
print 'ORIGINAL:', type(data[0]['b'])
print 'DECODED :', type(decoded[0]['b'])

take the content[1] for example

s.words
Out[68]: 
['熱水器',
 '加',
 '熱',
 '時間',
 '太',
 '長',
 ',',
 '安裝',
 '費',
 '太',
 '貴',
 ',',
 '預留',
 '太陽能',
 '口',
 '擺設',
 ',',
 '根本',
 '用',
 '不',
 '到',
 ',',
 '沒有',
 '水位',
 '指示器',
 ',',
 '加',
 '滿',
 '熱水',
 '的',
 '指示',
 '燈',
 '放在',
 '了',
 '最',
 '側面',
 ',',
 '不',
 '方便',
 '用戶',
 '看',
 '指示',
 '燈',
 ',',
 '必須',
 '斜',
 '著',
 '看',
 '才',
 '能',
 '看到',
 ',']

the train data use the

theme-主題                加熱時間;安裝費;用戶;
sentiment_word-情感關鍵詞      太長;太貴;不方便;

use a cycle

successfully split the words

..to be continue 1102

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 應該是夏天的尾巴了。陽光不再那么刺眼,風已經變得凌烈。那大片大片的玉米瘋狂的生長,一如那年彼此的擁抱,不知所措……...
    覺醒乖乖閱讀 437評論 1 7
  • 圖、文/簡書小二 游戲,我想大家或多或少都有一點兒接觸吧?,F在幾乎每家每戶都有電腦,人手一部手機,難免會接觸到各種...
    簡書小二閱讀 640評論 3 8
  • 分開以后我最大的領悟,不是我有多好也不是你有多壞,而是我看清了自己,更明白了兩個人在一起的意義,好的愛情,永遠是兩...
    白色帆布鞋_702c閱讀 598評論 0 1
  • 一個月總有那么幾天情緒低落的時候。 比女生的大姨媽還準時。 這種情況不只是我的專利,很多人都有,達達令老師也有,不...
    動動筆記閱讀 306評論 0 3
  • 直接上源碼吧自己看這里是通過創(chuàng)建adapter的時候傳進來的int數值來判斷當前選中的是哪一個 這里主要是做了一個...
    人生剛開始閱讀 7,149評論 1 1

友情鏈接更多精彩內容