python集合

        集合和字典类似,也是一组key的集合,但不存储value。由于key不能重复,所以,在集合中,没有重复的key。

        要创建一个集合,需要提供一个列表作为输入集合

1
2
3
>>> s = set([1, 2, 3])
>>> s
set([1, 2, 3])

        注意,传入的参数[1,2,3]是一个列表,而显示的set([1,2,3])只是说明这个集合内部有1,2,3这3个元素,显示的[]不表示这是一个列表。

        重复元素在集合中自动被过滤

1
2
3
>>> s = set([1, 1, 2, 2, 3, 3])
>>> s
set([1, 2, 3])

        通过add(key)方法可以添加元素到集合中,可以重复添加,但不会有效果

1
2
3
4
5
6
>> s.add(4)
>>> s
set([1, 2, 3, 4])
>>> s.add(4)
>>> s
set([1, 2, 3, 4])

        通过remove(key)方法可以删除元素

1
2
3
>>> s.remove(4)
>>> s
set([1, 2, 3])

        集合可以看成数学意思上的无需和无重复元素的集合,因此,零个集合可以做数学意义上的交集、并集等操作

1
2
3
4
5
6
>>> s1 = set([1, 2, 3])
>>> s2 = set([2, 3, 4])
>>> s1 & s2
set([2, 3])
>>> s1 | s2
set([1, 2, 3, 4])

        集合和字典的唯一区别仅在于没有存储对应的value,但是集合的原理和字典一样,所以,同样不可以放入可变对象,因为无法判断两个可变对象是否相等,也就无法保证集合内部“不会有重复元素”。

        字符串是不变对象,而列表是可变对象。

        对于可变对象,比如列表,对列表进行操作,列表内部的内容是会变化的

1
2
3
4
>>> a = ['c', 'b', 'a']
>>> a.sort()
>>> a
['a', 'b', 'c']

        而对不可变对象,比如字符串

1
2
3
4
5
>>> a = 'abc'
>>> a.replace('a', 'A')
'Abc'
>>> a
'abc'

        虽然字符串有个replace()方法,也确实变出了Abc,但变量a最后仍是abc

        应该这样理解

1
2
3
4
5
6
>>> a = 'abc'
>>> b = a.replace('a', 'A')
>>> b
'Abc'
>>> a
'abc'

        要始终牢记的是,a是变量,而abc才是字符串的对象!有些时候,对象a的内容是abc,但其实是指,a本身是一个变量,它指向的对象的内容才是abc

        当调用a.replace('a','A')时,实际上调用方法replace是左右能够在字符串对象abc上的,而这个方法虽然名字叫replace,但却没有改变字符串abc的内容。相反,replace方法创建了一个新的字符串Abc并返回,如果用变量b指向该新字符串,就容易理解了,变量a仍指向原有的字符串abc,但变量b却指向新字符串Abc

        所以,对于不变对象来说,调用对象自身的任意方法,也不回改变该对象自身的内容。相反,这些方法会创建新的对象并返回,这样,就保证了不可变对象本身永远是不可变的。