开发者

Python 集合之set详解

开发者 https://www.devze.com 2022-12-01 11:50 出处:网络 作者: 网络整理
目录引言集合的定义集合常用操作集合添加元素集合移除元素集合统计、清空元素集合元素获取(遍历)集合之间的运算集合差运算-集合并运算|集合交运算集合异或运算^应用场景普通for循环去重利用集合简单...
目录
  • 引言
  • 集合的定义
  • 集合常用操作
    • 集合添加元素
    • 集合移除元素
    • 集合统计、清空元素
    • 集合元素获取(遍历)
  • 集合之间的运算
    • 集合差运算 -
    • 集合并运算 |
    • 集合交运算 编程客栈&
    • 集合异或运算 ^
  • 应用场景
    • 普通for循环去重
    • 利用集合简单去重
    • 去重保持原来的顺序
  • 总结

    引言

    set(集合)虽然用的很少,但它是一个无序的不重复元素序列,用来简单的去重挺快的。

    集合的定义

    www.cppcns.com

    set(集合) 与列表类似,不同之处在于集合的 元素不重复

    集合和字典一样也是用 {} 定义,但元素之间使用 , 分隔,或者使用 set()

    { } 定义

    #!/usr/bin/python3
    # -*- coding:utf-8 -*-
    name_set = {'hui', 'wang', 'zack', 'hui'}
    print(name_set)    	# 结果为 {'hui', 'wang', 'zack'}
    name_set = set('hui', 'wang', 'zack', 'hui')
    

    set() 定义

    set() 只接受一个参数

    In [13]: name_set = set('hui')
    In [14]: name_set
    Out[14]: {'h', 'i', 'u'}
    In [15]: name_set = set(['hui', 'wang', 'zack', 'hui'])
    In [16]: name_set
    Out[16]: {'hui', 'wang', 'zack'}
    

    注意:空集合不能用 s = {} 来定义这样默认是字典,应该 s = set()

    In [27]: s = {}
    In [28]: s1 = set()
    In [29]: type(s)
    Out[29]: dict
    In [30]: type(s1)
    Out[30]: set
    

    集合常用操作

    集合所有内置方法如下:

    Python 集合之set详解

    方法太多我选几个常用的测试一下。

    集合添加元素

    使用 add() 即可向集合中添加元素

    In [33]: s = set()
    In [34]: s.add(1)
    In [35]: s.add(4)
    In [36]: s.add(3)
    In [37]: s
    Out[37]: {1, 3, 4}
    In [38]: s.add(2)
    In [39]: s
    Out[39]: {1, 2, 3, 4}
    

    集合移除元素

    • remove() 移除集合中的元素,且如果元素不存在,会报错
    • discard() 移除集合中的元素,且如果元素不存在,不会发生错误
    • pop() 随机移除集合内的一个元素

    In [38]: # remove() 移除
    In [39]: s
    Out[39]: {1, 2, 3, 4}
    In [40]: s.remove(3)
    In [41]: s
    Out[41]: {1, 2, 4}
    In [42]: s.remove(5)
    ---------------------------------------------------------------------------
    KeyError                                  Traceback (most recent call last)
    <ipython-input-42-9ec04578636f> in <module>
    ----> 1 s.remove(5)
    KeyError: 5
    
    In [45]: # discard() 移除
    In [46]: s
    Out[46]: {1, 2, 4}
    In [47]: s.discard(4)
    In [48]: s
    Out[48]: {1, 2}
    In [49]: s.discard(3)
    In [50]: s
    Out[50]: {1, 2}
    
    In [56]: # pop() 随机移除
    In [57]: s.pop()
    Out[57]: 1
    In [58]: s
    Out[58]: {2, 3, 9, 'hui'}
    In [59]: s.pop()
    Out[59]: 2
    In [60]: s
    Out[60]: {3, 9, 'hui'}
    

    其实set 集合的 pop方法会将集合的左边第一个元素进行删除,并返回删除的元素。

    集合统计、清空元素

    • len() 统计集合元素个数
    • clear() 清空集合

    In [68]: name_set
    Out[68]: {'wang', 'zack'}
    In [69]: len(name_set)
    Out[69]: 2
    In [71]: name_set.clear()
    In [72]: len(name_set)
    Out[72]: 0
    In [73]: name_set
    Out[73]: set()
    

    集合元素获取(遍历)

    集合不支持索引,也没有方法进行获取,因此只能采用 for ... in ... 遍历方式获取元素。

    In [81]: name_set
    Out[81]: {'hui', 'wang', 'zack'}
    In [82]: for name in name_set:
        ...:     print(name)
        ...:
    hui
    wang
    zack
    In [83]: name_set[0]
    ---------------------------------------------------------------------------
    TypeError                                 Traceback (most recent call last)
    <ipython-input-83-c0ead6d21f1d> in <module>
    ----> 1 name_set[0]
    TypeError: 'set' object is not subscriptable
    

    集合之间的运算

    集合差运算 -

    In [89]: a = {1, 2, 3, 4, 5}
    In [90]: b = {1, 2, 3, 6}
    In [91]: a - b
    Out[91]: {4, 5}
    In [92]: b - a
    Out[92]: {6}
    In [93]: a.difference(b)
    Out[93]: {4, 5}
    In [94]: b.difference(a)
    Out[94]: {6} 
    

    a - b 就相当于在 a 中去除跟 b 相同的元素b -编程客栈 a 也就是在 b 中去除跟 a 相同的元素a - b 等同于 a.difference(b)

    集合并运算 |

    In [95]: a
    Out[95]: {1, 2www.cppcns.com, 3, 4, 5}
    In [96]: b
    Out[96]: {1, 2, 3, 6}
    In [97]: a | b
    Out[97]: {1, 2, 3, 4, 5, 6}
    

    集合交运算 &

    In [99]: a
    Out[99]: {1, 2, 3, 4, 5}
    In [100]: b
    Out[100]: {1, 2, 3, 6}
    In [101]: a & b
    Out[101]: {1, 2, 3}
    

    集合异或运算 ^

    In [102]: a
    Out[102]: {1, 2, 3, 4, 5}
    In [103]: b
    Out[103]: {1, 2, 3, 6}
    In [104]: a ^ b
    Out[104]: {4, 5, 6}
    

    把 a, b 集合中的相同元素都去掉,剩下的就是 ^ 异或运算的结果。

    应用场景

    普通for循环去重

    In [1]: li = [2, 1, 3, 6, 2, 1]
    In [2]: temp = []
    In [3]: for i in li:
       ...:     if i not in temp:
       ...:         temp.append(i)
       ...:
    In [4]: li
    Out[4]: [2, 1, 3, 6, 2, 1]
    In [5]: temp
    Out[5]: [2, 1, 3, 6]
    

    利用集合简单去重

    In [106]: li = [1, 2, 2, 3, 3, 5]
    In [107]: li = set(li)
    In [108]: li
    Out[108]: {1, 2, 3, 5}
    In [109]: type(li)
    Out[109]: set
    In [110]:
    

    这样把原来的列表类型变成了集合类型,这样更不好操作,这样不是想要的结果。

    因此要做到 去重加类型不变,只要再嵌套一个list() 即可

    In [110]: li = [1, 2, 2, 3, 3, 5]
    In [111]: li = list(set(li))
    In [112]: li
    Out[112]: [1, 2, 3, 5]
    In [113]: type(li)
    Out[113]: list
    In [114]:
    

    去重保持原来的顺序

    使用 sort + set 去重

    In [6]: list1 = [2, 1, 3, 6, 2, 1]
    In [7]: list2 = list(set(list1))
    In [8]: list2
    Out[8]: [1, 2, 3, 6]
    In [9]: list2.sort(key=list1.index)
    In [10]: list2
    Out[10]: [2, 1, 3, 6]
    

    使用 sorted + set 去重

    In [12]: list1 = [2, 1, 3, HIXNgxexV6, 2, 1]
    In [13]: temp = sorted(set(list1), key=list1.index)
    In [14]: temp
    Out[14]: [2, 1, 3, 6]
    

    总结

    本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注我们的更多内容!

    0

    精彩评论

    暂无评论...
    验证码 换一张
    取 消

    关注公众号