网站首页 > 基础教程正文

一起学数据分析之NumPy(02)——数据类型

ccvgpt 2024-10-12 13:28:41 基础教程 8 ℃

dtype是一个特殊的对象，它含有ndarray将一块内存解释特定数据类型所需的信息：

 import numpy as np
 arr1 = np.array([1, 2, 3], dtype=np.float64)
 arr2 = np.array([1, 2, 3], dtype=np.int32)

 arr1.dtype

 dtype('float64')

 arr2.dtype

 dtype('int32')

 # 使用astype函数显示转换ndarray的dtype
 # 整数转换成浮点数
 arr = np.array([1, 2, 3, 4, 5])
 arr.dtype

 dtype('int32')

 float_arr = arr.astype(np.float64)
 float_arr.dtype

 dtype('float64')

 # 浮点数转换成整数
 arr = np.array([1.3, 2.3, -5.6, -7.8, 9.4 ])
 arr

 array([ 1.3,  2.3, -5.6, -7.8,  9.4])

 arr.dtype

 dtype('float64')

 arr.astype(np.int32)

 array([ 1,  2, -5, -7,  9])

 arr.dtype
 # 注意：浮点数转换成整数，会截断小数部分

 dtype('float64')

 # 如果字符串数组元素全部都是数字，也可以用astype将其转换为数值表示：
 numeric_strings = np.array(['1.2', '4.5', '4', '6.4', '9'], dtype=np.string_)

 numeric_strings.astype(np.float64)

 array([1.2, 4.5, 4. , 6.4, 9. ])

 # 你也可以偷懒直接写成这样
 numeric_stings.astype(float)

 array([1.2, 4.5, 4. , 6.4, 9. ])

 # dtype还可以直接引用赋值，举个例子：
 int_array = np.arange(10)
 calibers = np.array([.22, .270, .357, .380, .44, .50], dtype=np.float64)
 # 我想把int_array的dtype变成跟calibers一样可以直接赋值
 int_array.astype(calibers.dtype)

 array([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

 # 你也可以用简洁的类型代码来表示dtype，u指unit，8指8字节
 empty_unit32 = np.empty(8, dtype='u8')
 empty_unit32

 array([   0,    0,    0,    0,    0, 1104,    0,    0], dtype=uint64)

 # 但是注意，调用astype会创建一个新的数组(拷贝)，及时新数组跟老数组的dtype相同也是如此。
 # 数据类型对于大数据集的存储和计算尤为重要，但是通常来说，你只要把它当成还是普通的Python对象就行，大致类型无非就是浮点、复数、整数、布尔、字符串等。

dtype 是NumPy如此强大和灵活的原因之一。数值型dtype的命名方式相同：一个类型名（float，int等），后面跟一个用于表示各元素长的数字。 NumPy的数据类型这里不做更多的说明，有兴趣的读者可以自己查询。

一起学数据分析之NumPy(02)——数据类型

上一篇： Pandas 的常用数据类型概述 pandas数据类型有哪些
下一篇：数据分析和机器学习框架底层工具NumPy的数据类型与数组属性

网站首页 > 基础教程 正文

一起学数据分析之NumPy(02)——数据类型

猜你喜欢

网站首页 > 基础教程正文