旗下导航:搜·么
当前位置:网站首页 > Python教程 > 正文

爬虫的剖析体式格局一:JOSN剖析【Python教程】,python,爬虫,JOSN

作者:搜教程发布时间:2019-11-27分类:Python教程浏览:25评论:0


导读:浩瀚言语都能举行爬虫,但基于python的爬虫显得越发简约,轻易。爬虫也成了python言语中必不可少的一部分。爬虫剖析数据的体式格局有很多种,在上一篇给人人引见的是爬虫能猎取...
浩瀚言语都能举行爬虫,但基于python的爬虫显得越发简约,轻易。爬虫也成了python言语中必不可少的一部分。爬虫剖析数据的体式格局有很多种,在上一篇给人人引见的是 爬虫能猎取什么样的数据和细致的剖析体式格局 ,本篇给人人带来的是JSON剖析。

JSON

json简单说就是javascript中的对象和数组,所以这两种构造就是对象和数组两种构造,经由过程这两种构造能够示意种种庞杂的构造。

对象:

对象在js中示意为{ }括起来的内容,数据构造为 { key:value, key:value, ... }的键值对的构造,在面向对象的言语中,key为对象的属性,value为对应的属性值,所以很轻易明白,取值要领为 对象.key 猎取属性值,这个属性值的范例能够是数字、字符串、数组、对象这几种。

数组:

数组在js中是中括号[ ]括起来的内容,数据构造为 ["Python", "javascript", "C++", ...],取值体式格局和一切言语中一样,运用索引猎取,字段值的范例能够是 数字、字符串、数组、对象几种。

JSON(JavaScript Object Notation) 是一种轻量级的数据交换花样,它使得人们很轻易的举行浏览和编写。同时也轻易了机械举行剖析和生成。适用于举行数据交互的场景,比方网站前台与背景之间的数据交互。

import json
def resolveJson(path):
    file = open(path, "rb")
    fileJson = json.load(file)
    field = fileJson["field"]
    futures = fileJson["futures"]
    type = fileJson["type"]
    name = fileJson["name"]
    time = fileJson["time"]
    return (field, futures, type, name, time)
def output():
    result = resolveJson(path)
    print(result)
    for x in result:
        for y in x:
            print(y)
path = r"C:\Users\dell\Desktop\kt\test.json"
output()

注重函数返回多个值时返回的是一个元组tuple;

对一个字符串举行for轮回的时刻会对每一个字符举行遍历

Python JSON

本章节我们将为人人引见怎样运用 Python 言语来编码和解码 JSON 对象。

JSON(JavaScript Object Notation) 是一种轻量级的数据交换花样,易于人浏览和编写。

JSON 函数

运用 JSON 函数须要导入 json 库:import json。

函数 形貌

json.dumps 将 Python 对象编码成 JSON 字符串

json.loads 将已编码的 JSON 字符串解码为 Python 对象

json.dumps

json.dumps 用于将 Python 对象编码成 JSON 字符串。

语法

json.dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, encoding="utf-8", default=None, sort_keys=False, **kw)

实例

以下实例将数组编码为 JSON 花样数据:

#!/usr/bin/python
import json
data = [ { 'a' : 1, 'b' : 2, 'c' : 3, 'd' : 4, 'e' : 5 } ]
json = json.dumps(data)
print json

以上代码实行效果为:

[{"a": 1, "c": 3, "b": 2, "e": 5, "d": 4}]

运用参数让 JSON 数据花样化输出:

>>> import json
>>> print json.dumps({'a': 'Runoob', 'b': 7}, sort_keys=True, indent=4, separators=(',', ': '))
{
    "a": "Runoob",
    "b": 7
}

python 原始范例向 json 范例的转化对照表:

Python JSON

dict object

list, tuple array

str, unicode string

int, long, float number

True true

False false

None null

json.loads

json.loads 用于解码 JSON 数据。该函数返回 Python 字段的数据范例。

语法

json.loads(s[, encoding[, cls[, object_hook[, parse_float[, parse_int[, parse_constant[, object_pairs_hook[, **kw]]]]]]]])

实例

以下实例展现了Python 怎样解码 JSON 对象:

<pre>
#!/usr/bin/python
import json
jsonData = '{"a":1,"b":2,"c":3,"d":4,"e":5}';
text = json.loads(jsonData)
print text
</pre>

以上代码实行效果为:

{u'a': 1, u'c': 3, u'b': 2, u'e': 5, u'd': 4}

json 范例转换到 python 的范例对照表:

JSON Python

object dict

array list

string unicode

number (int) int, long

number (real) float

true True

false False

null None

运用第三方库:Demjson

Demjson 是 python 的第三方模块库,可用于编码和解码 JSON 数据,包含了 JSONLint 的花样化及校验功用。

Github 地点:https://github.com/dmeranda/demjson

官方地点:http://deron.meranda.us/python/demjson/

环境设置

在运用 Demjson 编码或解码 JSON 数据前,我们须要先装置 Demjson 模块。本教程我们会下载 Demjson 并装置:

$ tar -xvzf demjson-2.2.3.tar.gz
$ cd demjson-2.2.3
$ python setup.py install

JSON 函数

函数 形貌

encode 将 Python 对象编码成 JSON 字符串

decode 将已编码的 JSON 字符串解码为 Python 对象

encode

Python encode() 函数用于将 Python 对象编码成 JSON 字符串。

语法

demjson.encode(self, obj, nest_level=0)


实例

以下实例将数组编码为 JSON 花样数据:

<pre>
#!/usr/bin/python
import demjson
data = [ { 'a' : 1, 'b' : 2, 'c' : 3, 'd' : 4, 'e' : 5 } ]
json = demjson.encode(data)
print json
</pre>

以上代码实行效果为:

[{"a":1,"b":2,"c":3,"d":4,"e":5}]


decode

Python 能够运用 demjson.decode() 函数解码 JSON 数据。该函数返回 Python 字段的数据范例。

语法

demjson.decode(self, txt)

实例

以下实例展现了Python 怎样解码 JSON 对象:

<pre>
#!/usr/bin/python
import demjson
json = '{"a":1,"b":2,"c":3,"d":4,"e":5}';
text = demjson.decode(json)
print  text
</pre>

以上代码实行效果为:

{u'a': 1, u'c': 3, u'b': 2, u'e': 5, u'd': 4}

以上就是爬虫的剖析体式格局一:JOSN剖析的细致内容,更多请关注ki4网别的相干文章!

标签:python爬虫JOSN


欢迎 发表评论: