集合(set)とは、重複のない要素の集まりです。数学の集合と同じような概念で、順序は持ちません。Pythonでは、集合を使って、ユニークな要素の管理や、複数のデータの共通部分や差分を簡単に求めることができます。
以下に、集合の基本的な使い方を説明します:
集合の作成
# 波括弧を使用して作成
fruits = {'apple', 'banana', 'orange'}
print(fruits) # 出力: {'orange', 'banana', 'apple'}
# set()関数を使用して作成
numbers = set([1, 2, 3, 4, 5])
print(numbers) # 出力: {1, 2, 3, 4, 5}
要素の追加と削除
fruits = {'apple', 'banana'}
# 要素の追加
fruits.add('orange')
print(fruits) # 出力: {'apple', 'banana', 'orange'}
# 要素の削除
fruits.remove('banana')
print(fruits) # 出力: {'apple', 'orange'}
集合演算
set1 = {1, 2, 3, 4, 5}
set2 = {4, 5, 6, 7, 8}
# 和集合 (union)
print(set1 | set2) # 出力: {1, 2, 3, 4, 5, 6, 7, 8}
# 積集合 (intersection)
print(set1 & set2) # 出力: {4, 5}
# 差集合 (difference)
print(set1 - set2) # 出力: {1, 2, 3}
集合の特徴
# 重複は自動的に削除される
numbers = {1, 2, 2, 3, 3, 4}
print(numbers) # 出力: {1, 2, 3, 4}
# 順序は保証されない
fruits = {'apple', 'banana', 'orange'}
print(fruits) # 出力は実行ごとに異なる可能性がある
集合は、特にデータの重複を除去したり、複数のデータの共通部分や差分を求めたりする場合に非常に便利です。また、要素の存在確認も高速に行えるため、大量のデータを扱う際にも効率的です。