百度AI攻略:百度地址識別

1.功能描述:

百度地址識別精準提取快遞填單文本中的姓名、電話、地址信息,通過自然語言處理輔助地址識別做自動補充和糾正,生成標準規(guī)范的結構化信息,大幅提升企業(yè)效率。

地址信息提取:精準提取文本填單中的地址信息,并按省、市、區(qū)、街道、詳細地址的格式結構化輸出

地址糾正:針對地址信息中用戶填錯的省、市、區(qū)、街道等字段內容進行輔助糾正

地址補全:結合地圖POI數據,幫助補全用戶在地址填寫步驟中缺失的地理位置信息

姓名信息提?。壕珳侍崛∥谋咎顔涡畔⒅惺占嘶蚣募说拿Q,并輸出結構化信息

電話信息提取:精準提取文本填單信息中寄件人或收件人的聯系方式,并輸出結構化信息

2.平臺接入

具體接入方式比較簡單,可以參考我的另一個帖子,這里就不重復了:

http://ai.baidu.com/forum/topic/show/943327

3.調用攻略(Python3)及評測

3.1首先認證授權:

在開始調用任何API之前需要先進行認證授權,具體的說明請參考:

http://ai.baidu.com/docs#/Auth/top

具體Python3代碼如下:

# -*- coding: utf-8 -*-

#!/usr/bin/env python

import urllib

import base64

import json

#client_id 為官網獲取的AK, client_secret 為官網獲取的SK

client_id =【百度云應用的AK】

client_secret =【百度云應用的SK】

#獲取token

def get_token():

host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret

request = urllib.request.Request(host)

request.add_header('Content-Type', 'application/json; charset=UTF-8')

response = urllib.request.urlopen(request)

token_content =?response.read()

#print (token_content)

if token_content:

token_info = json.loads(token_content)

token_key = token_info['access_token']

return token_key

3.2百度地址識別分析接口調用:

詳細說明請參考:?https://ai.baidu.com/ai-doc/NLP/vk3pmn49r

說明的比較清晰,這里就不重復了。

大家需要注意的是:

API訪問URL:https://aip.baidubce.com/rpc/2.0/nlp/v1/address

Python3調用代碼如下:

#調用百度地址接口

def address(content):

? ? token=get_token()

? ? url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/address'

? ? params = dict()

? ? params['text'] = content

? ? params = json.dumps(params).encode('utf-8')

? ? access_token = token


? ? begin = time.perf_counter()

? ? url = url + "?access_token=" + access_token

? ? request = urllib.request.Request(url=url, data=params)

? ? request.add_header('Content-Type', 'application/json')

? ? response = urllib.request.urlopen(request)

? ? content = response.read()


? ? end = time.perf_counter()

? ? print('處理時長:'+'%.2f'%(end-begin)+'秒')


? ? if content:

? ? ? ? content=content.decode('GBK')

? ? ? ? data = json.loads(content)

? ? ? ? #print ('原文')

? ? ? ? #print ('省:',data['text'])

? ? ? ? print ('地址')

? ? ? ? print ('?。?,data['province'])

? ? ? ? print ('市:',data['city'])

? ? ? ? print ('區(qū):',data['county'])

? ? ? ? print ('街道:',data['town'])

? ? ? ? print ('詳細地址:',data['detail'])

? ? ? ? print ('聯系人')

? ? ? ? print ('姓名:',data['person'])

? ? ? ? print ('聯系方式:',data['phonenum'])

4.功能評測:

具體效果如下:

5.測試結論和建議

測試下來,整體識別效果不錯。百度地址識別的很準確,速度也很快,用起來非常的方便。對于對地址需要快速識別的行業(yè)會非常的有幫助。比如可以用于快遞單據識別,解析并提取快遞單據中的文本信息,標準規(guī)范的輸出結構化信息,包含姓名、電話、地址,其中地址能夠自動將街道及行政區(qū)的信息補全,幫助快遞或電商企業(yè)提高單據處理效率

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 2018年1月15日 星期一 天氣晴 三天的休息時間轉眼間飛逝而過,新的一周又開始了。下周一孩子們就要考試了,...
    太陽玥玥閱讀 188評論 0 0
  • 進來看的人,是不是都是來看笑話的,呵,你們就是笑話?。ǜ杏X被坑了嗎) (未完待續(xù))
    墨倪閱讀 118評論 1 2
  • 資本利得和分紅是投資指數基金的兩個主要收益來源,資本利得是指我們買賣賺得的差價,分紅是指數基金的分紅。 當然,并不...
    好多番茄閱讀 268評論 0 1
  • 有時候,我甚至相信:只有破碎的東西才是美麗的。 我喜歡斷樹殘枝萎葉,也喜歡舊寺銹鐘頹墻;喜歡庭院深...
    卡酷卡酷good閱讀 430評論 0 1
  • 本條文稿參考《科學美國人》2月刊 知識清單 《科學美國人》 美國歷史非常悠久的科普雜志,1845年創(chuàng)刊至今,已經有...
    彩云體脂管理師閱讀 504評論 0 0

友情鏈接更多精彩內容