专业编程基础技术教程

网站首页 > 基础教程 正文

使用Python 获取多级字典(Json)格式所有Key、Value

ccvgpt 2025-01-07 11:10:47 基础教程 3 ℃

在编程数据处理时,经常能碰到多级包含多类型的字典,例如下图:

客户要求取到所有根部key,value并写入DataFrame中,下面用我的方法来实现:

使用Python 获取多级字典(Json)格式所有Key、Value

#新建存放key,value的数组
data = []
#重名计数变量
name_count=1
other_count=1
#取到字典
A=eval(response.text)
d=A["data"]
#循环遍历字典
for k, v in d.items():
    #print(k,v)
    if isinstance(v, dict):
        # 如果字典中的值是字典类型,继续判断是否数组
        for sub_k, sub_v in v.items():
            #print(type(sub_v))
            if isinstance(sub_v, list):
                #print(sub_v)
                #如果时数组则循环数组
                for sub_1_lst in sub_v:
                    #判断数组中的字典类型
                    if isinstance(sub_1_lst, dict):
                        #print(list(sub_v[0].keys()))
                        #继续循环遍历数组中的每个字典
                        for sub_1_k, sub_1_v in sub_1_lst.items():
                            #print(sub_1_k, sub_1_v)
                            #以下时重名判断,根据需要自定义
                            if sub_1_k=="name" :
                                data.append(( sub_1_k+str(name_count), sub_1_v))
                                name_count+=1
                                
                            elif sub_1_k=="riskPremSum":
                                data.append(( sub_1_k+str(other_count), sub_1_v))
                                other_count+=1
                            else:
                                data.append(( sub_1_k, sub_1_v))                  
    #如果不是字典则再次判断是否时数组                                          
    elif isinstance(v, list):
        # 如果字典中的值是列表类型
        for i, item in enumerate(v):
            print(i,item)
            #继续循环遍历数组中的每个字典
            if isinstance(item, dict):
                # 如果列表中的元素是字典类型,
                for sub_k, sub_v in item.items():
                    #以下时重名判断,根据需要自定义
                    if sub_k=="name" :
                        data.append((sub_k+str(name_count), sub_v))
                        name_count+=1
                    elif sub_k=="riskPremSum":
                        data.append((sub_k+str(other_count), sub_v))
                        other_count+=1
                    else:
                        data.append((sub_k, sub_v))
            else:
                data.append((k + '.' + str(i), item))
    #如果非字典非数组则直接写入   
    else:
        if k=="name" :
            data.append((k+str(name_count), v))
            name_count+=1
        elif k=="riskPremSum":
            data.append((k+str(other_count), v))
            other_count+=1
        else:
            data.append((k, v))
        

结果

写入DataFrame

df=pd.DataFrame({"a":[]})
for ss in data:
    #print(ss)
    df.loc[0,ss[0]]=ss[1]
df  

以上是我个人的笨方法,整体思路就是逐级读取判断,弊端就是字典的层数少,chatGPT给我的是递归方法,我没太理解,同学们如果还有更好的方法欢迎指导,谢谢!

最近发表
标签列表