個人メモです
化学ポータルサイト
> Chem-Station (ケムステ)
> ChemPort (有機化学者のためのポータルサイト)
化学データベース(ログイン不要または無料登録)
> ChemSpider(低分子データベース、化学構造で検索可)
> Chemical Book
> J-GLOBAL(日化辞 Web)
> PubChem(低分子データベース、化学構造で検索可)
※(DATA)JSON,XML,ASNT;(2D Structure)SDF,JSON,XML,ASNT;(3D Structure)SDF,JSON,XML,ASNT
> 有機化合物のスペクトルデータベース(SDBS)
InChI,InChI Key
> ChEMBL(生物活性低分子のデータベース、化学構造で検索可)
Molfile,SMILES,InChI,InChI Key
search; Similar Compounds,Alternative Forms
> NIST Chemistry WebBook
米 NIST(National Institute of Standards and Technology:国立標準技術研究所)によるデータベース
> CCDC:Access Structures
登録番号、化合物名、DOI(デジタルオブジェクト識別子)、書誌情報などで検索可能
CIFデータを無償でダウロード可能
構造式や組成式、原子間距離などで結晶構造の検索は有償
> シグマアルドリッチ(メルク)
製品情報などの検索
> ChemIDplus Advanced(United States National Library of Medicine)
一部の化合物については、沸点、融点、溶解度などの物性値からの検索に対応
(検索条件)
・Substance Identification :名称、別名、CAS Registry Number、分子式などによる検索
・Toxicity :毒性データによる検索。対象、経路などの条件を選択。
・Physical Properties: 融点、沸点、溶解度など基本的な物性値。
・Locator Codes :CCRIS外部サイトへのリンクやPubMed外部サイトへのリンクなど、検索対象のデータベースを選択。
・Structure : 画面上で構造式を作成、又はMOLファイルを取り込み、構造式と一致・類似するもの、などの条件で検索。
・Molecular Weight : 分子量から一致・範囲などで検索
(取得)SMILES(download),InChI(download),InChI Key(search web)
化学データベース(要契約)
> SciFinder(要契約)
ACSによる化学情報データベースサービス CAS (Chemical Abstracts Service) のオンライン版
大きく文献情報、化学物質情報、有機化学反応情報
→SciFinderのe-ラーニング (自習用教材)
> Springer Materials (The Landolt-Börnstein Database) (企業・大学単位での契約が多い)
Springer Nature社による物理・化学・技術工学分野における物質情報を提供する。「Landolt-Börnstein」全巻をはじめとする複数のデータベースから構成される。
CAS-RN,InChI,InChI Keyなどはログインなしでも検索可能。
物性などはログイン後(鍵付き)。
化学データベース(変換)
> CTS - The Chemical Translation Service:Simple Conversion
化合物の名称など情報が分かっている場合、CAS RN、Pubchem番号を調べるなど
眺めるサイト(動画など)
> Beautiful Chemistry
> clarafi
ケモ・インフォマティクス ツール:Fingerprintライブラリ
>RDkit
・Python2,3、Java,C#
・ソースコードのみ(2016.03.01まではWin用バイナリ有)
・6ヶ月ごとにリリース
>CDK
※GitHubよりjarダウンロード(ソースコードも可能)
>PaDEL-Descriptor
※(here)よりzipダウンロード:PaDEL-Descriptor.zip(PaDEL-Descriptor.jar)
>JCompoundMapper
(which is based on CDK)
※jarダウンロード:jCMapperCLI.jar,jCMapperLibOnly.jar (Modified:2012-12-03 !)
>Pybel
>Chemopy
>Dragon
・ChemDes(Molecular fingerprints library)
Fingerprint一覧
ソフトウェア
化学ファイルフォーマット変換
OpenBabel
・Avogadro
Open Source
※installer:Avogadro-1.2.0n-win32.exe
・Jmol
※Jmol-14.30.1-binary.zipを展開
・PubChem 3D Viewer 化学構造式を見る
※installer:setupPC3Dv2.exe
・ChemSketch 化学構造式を描ける
Free版, Trial版 登録したメールからダウンロード
※ACDLabs201912_ChemSketchFree_Install.zip
・[ChemDraw]
・Mercury
「Mercury (incorporating enCIFer)」をクリックし、該当OSの「Download」をクリック
・Marvin Sketch
ユーザ登録後、ダウンロード可能
化学式
> イオン式(ionic formula)
イオン物質を表す化学式
例: H+、F-
> 電子式 (ルイス構造式(Lewis structure):ルイス(1916年)が考案)
「元素記号の周囲に,最外殻電子を点・で表した式」であり、
「原子同士の結合に関与する電子(価電子)対をコロン「:」で表現した式」
※最外殻電子 ・・・最も外側にある電子殻に存在する電子
※価電子 ・・・最外殻電子のうち、反応に使われる電子
記載法参考: 化学【5分でわかる】電子式の書き方と一覧、構造式と分子式の違い
(前提) :元素記号の周りに最外殻電子の箱が4方向にあると仮定する
ルール1 :元素記号の周りの1つの箱に価電子は最大2つまで入る
ルール2 :出来るだけ対にならないように4つの箱に1つずつ順番に入れていく
ここで、、
電子対 :箱に2個の価電子が入ったもの ⇒ 2個で対になったとき原子中の価電子は安定する
不対電子 :箱に1個しか価電子が入ってないもの ⇒ 対になっておらず不安定
(不対電子は不安定のため、他の原子と不対電子を出し合い共有する)
共有電子対 :2つの原子が電子を1個ずつ出し合うことで形成される電子対(結合前は不対電子)
非共有電子対 :1つの原子が持つ電子のみで形成される電子対(結合前は電子対)
例: H:H
(電子式をさらに簡略化:結合に関与しない非共有電子対を省略 ----> 構造式)
> 構造式(structural formula)
共有結合の1組(:)である共有電子対を1本の線(-)で表し、結合の様子を表した式
⇒ 原子と原子の結合を表現するために使われる式
※価標: 原子と原子の結合を表現するために使われる線(-)
記載法参考: 構造式の書き方!化学の基本として知っておきたいルールとは?
ルール :原子価をすべて使い切らないといけない
注意点1:省略した場合アルファベット順に並べる
注意点2:官能基の表記は逆さまになっても良い
(例:カルボキシ基はCOOHという構成になっているが、構造式ではHOOCという表記でもよい
⇒さらに見ると、価標が左に付く場合は-COOHという書き方で、価標が右に付く場合はHOOC-となる)
例: H-H、H-O-H、O=O
> 示性式(rational formula)
分子式から、官能基をわかりやすく明示した式のこと
※官能基(functional group):有機化合物の性質を決める特定の原子の集まり
例: C2H3COOH、H2
> 分子式(molecular formula)
原子の数をアルファベット順で表した式
例: C2H4O2、H2
> 組成式(compositional formula,nominal composition)
原子の数の比を整数比で表現している式のこと
例: CH2O
(と色々あるが、コンピュータには扱いづらい)
化学構造フォーマット
[参考サイト]ケモインフォマティクスで使われるファイル形式と化合物の描画方法
・分子の構造を原子の繋がりを中心に考える方法
・分子内の原子の空間における位置を中心に考える方法
線形表記法(Chemical line notations)
欠点:原子の座標位置・結合距離といった情報が失われる
利点:データサイズを小さくできる
利点:データベースでの運用に適している
– InChI記法(The IUPAC InternaTonal Chemical Identifier)
– SMILES記法(Simplified molecular input line entry specification)
水素原子は省略、化学構造の分岐は() を使用、二重結合は =、三重結合は #、芳香族環の原子は小文字
SMILES記法の詳細な規則
– SMARTS記法
– SLN(SYBYL Line Notation)
Chemical table files
– MOL file, SDF
– KCF(KEGG Chemical Function)
– PDB形式(Protein Data Bank Format) ・・・タンパク質構造データバンク(PDB)という,タンパク質や核酸の3次元構造が登録されているデータベースで使われているファイル形式
Chemical XML
– CML(Chemical Markup Language)
特定分野で使われるフォーマット
CIF形式 ・・・X線構造を表現するために用いられている形式
CCDC (Cambridge Crystallographic Data Centre)は特に低分子のX線構造データが集められたデータベース
IUPAC命名法
InternaTonal Union of Pure and Applied Chemistry
最も長い炭素直鎖に数詞をつけて命名
論文
リンク集
> Yoshibibu Ishikawa(有用リンク)
膨大なリンク
参考
https://future-chem.com/smiles-smarts/#PubChem
http://www.cheminfo.org/flavor/malaria/Utilities/SMILES_generator___checker.html