X線結晶解析> CrystalClear1.3> 解析後

解析終了後

データ転送

 LEBRA内には蛋白質のX線結晶解析の実施に向けて、X線回折装置・制御用PCを含め、以下のものが設置されている。

 立体構造解析を行うためには、反射データ(ScalAveraged.ref)を、制御用PCから解析用PC“protein”に転送する。
 CrystalClear ver.1.3.6 SP3によるデータの再処理を行う場合は、回折データ(oscファイル)を全て、“protein2”に転送する。

 この3つのPC間でのデータのやり取りは、2009年4月現在、全てネットワーク経由での転送に落ち着いる。
 各PC間のデータ転送の手段は以下の通り(図4.1)。

“protein”へのデータ転送

 “prtein”には、立体構造解析に必要な、反射データ(Scaleaveraged.ref)を転送する。
 併せてdtscaleaverage.logを転送しておくと、結晶系の確認などに便利。
  1. 構造解析用PC“protein”を起動。
    *“protein”のログインに関しては、装置管理者にご確認下さい。
  2. 制御用PCディスクトップ“ネットワークコンピュータ”→“Protein”をクリック。
    ⇒ ユーザー名、パスワードの入力画面が表示。
  3. ユーザー名等、入力し“OK”。
    *ユーザー名、パスワード共、“protein”のログイン時のものと同一。
  4. “Protein”→“lebra”をクリック。
  5. “Protein / lebra”へ、反射ファイル(Scaleaveraged.ref)(及びdtscaleaverage.log)をドラッグ&ドロップ。
    (注) ファイル名は必要に応じて変更。
    ⇒ 以上で、転送完了。
    *転送したファイルは、解析用PC“protein”の「protein-DataShare」フォルダ内に保存。

“protein2”へのデータ転送

 回折データの再処理には、収集した全回折データ(oscファイル)が必要なため、それら全てを“protein2”へ転送。

  1. 解析用PC“protein2”を起動。
    *“protein2”のログインに関しては、装置管理者にご確認下さい。
  2. 制御用PCディスクトップ“ネットワークコンピュータ”→“Protein2”→“00XRD_Data”をクリック。
  3. “Protein2 / 00XRD_Data”へ、回折データ(oscファイル)を「Images」フォルダごと、ドラッグ&ドロップ。
    (注) フォルダ名は必要に応じて変更。
    ⇒以上で、転送作業完了。
    *転送したフォルダ(「Images」)は、解析用PC“protein2”のディスクE:「00XRD_Data」フォルダに保存。
     (注) 回折データは合計数GBになるため、転送に数十分要する。


(図4.1)データ転送

その他

 以下に、公表時に必要となるデータとその評価基準、また、回折実験を繰り返し行う場合の参考情報、を記述する。

データの評価

 論文等で公表されているパラメーター(回折実験に関わるもの)をしては、以下が上げられる。
 *どのパラメーターを公表するかは雑誌による。

  1. 空間群(space group)
  2. 格子乗数(unit cell dimensions)
  3. 分解能(resolution range)
  4. 観測された反射数(No. of reflections)
  5. 独立の反射数(No. of unique refections)
  6. R-merge
  7. 完全性(Completeness)
  8. 多重度(“multiplicity” or “redundancy”)
  9. I/σ(I) (“average I / sigmaI” or “mean I / sigmaI” 等と記述される事もある)

 これらのデータは全て、Scale and Averageを実行後のファイルdtscaleaverage.logに、記述されている。
 回折実験の結果を評価する上での、これらのパラメーターの判断基準を示す。

1. 空間群(space group)
 dtscaleaverage.logでは「Space group number:, name」として記載。通常、「name」で公表。

2. 格子乗数(unit cell dimensions)
 「Unit cell lengths」「Unit cell angles」として記載。通常、「Unit cell volume」が公表される例は少ない。
 なお、場合によっては構造解析を進めないと、空間群を決定できない場合はある(参照「Spacegroup Foundについて」)。

3. 分解能(resolution range)
 「Completeness vs Resolution」等の「Resolution range」として記載。
 なお、データの幾つかは最外郭(“final shell” or “highest resolution shell”)分解能での値も示す必要がある。
 下の例1では全分解能は53.65-2.02(Å)、最外郭の分解能は2.09-2.02(Å)となる。

(例1)
Completeness vs Resolution
--------------------------------------------------------------------------------
 Resolution      Calc     Num    Num     Num     Num    Num    Avg  %Comp  %Comp
    range      unique     obs   rejs   mults  single unique   mult  shell  cumul
--------------------------------------------------------------------------------
 53.65 - 4.35    2367    6616    405    1997     185   2182   2.85   92.2   92.2
  4.35 - 3.45    2331    6580     69    2076     208   2284   2.85   98.0   95.1
 …(中略)…
  2.18 - 2.09    2301    6267      0    2025     276   2301   2.72  100.0   98.7
  2.09 - 2.02    2282    6189      1    2000     282   2282   2.71  100.0   98.8
--------------------------------------------------------------------------------
 53.65 - 2.02   23056   63949    519   20407    2380  22787   2.78   98.8   98.8

4. 観測された反射数(No. of reflections)
 「Completeness vs Resolution」等の「Num obs」がそれにあたる。
 多いに越したことはないが、撮影画像の枚数によって大きく変化する。記載されない場合も多い。
 実際には観察された反射数より、次の「5. 独立の反射数」、「8. 多重度」が重要かもしれない。

5. 独立の反射数(No. of unique refections)
 「Completeness vs Resolution」等の「Num unique」がそれにあたる。
 4. 同様、多いに越したことはないが、解析しているタンパク質、分解能によって変化する。

 観測された反射のうち、幾つかは回折データから除かれ、この数が多ければ回折データの質が悪いと言える。
 dtscaleaverage.logの最後に「… reflections total rejected ( 0.81% |Deviation|/sigma > 19.84)」等の記述があるが、 棄却数が10%を超える場合、得られている回折データの質に問題があると考えるべきであろう。

6. R-merge
 「Rmerge vs Resolution」の「Rmerge shell」。通常、累積と最外郭の分解能の値を記載する。
 下の例2では、累積のR-mergeが0.039(=3.9%)、最外郭(2.16-2.09Å)のR-mergeが0.115(=11.5%)。

(例2)
Rmerge vs Resolution
--------------------------------------------------------------------------------
 Resolution   Average     Num    Num     Num     Num  <<I>/  Rducd Rmerge Rmerge
    range      counts     obs   rejs   ovlps   mults <sig>>  ChiSq  shell  cumul
--------------------------------------------------------------------------------
 53.66 - 4.50   11319    5996    367    5466    1806   27.0   2.35  0.025  0.025
  4.50 - 3.57   12313    5914     65    5657    1863   24.9   2.08  0.029  0.027
 …(中略)…
  2.25 - 2.16     871    5644      0    5410    1832    4.7   0.80  0.107  0.038
  2.16 - 2.09     668    5677      0    5429    1839    4.0   0.57  0.115  0.039
--------------------------------------------------------------------------------
 53.66 - 2.09    4225   57997    481   55409   18487   12.6   1.21  0.039  0.039

 R-mergeは、等価な反射の強度のばらつき具合を示す指標。
 累積で5%以下なら良質のデータ、10%以下で問題なく解析が行える値と言える。20%以上ではデータの信憑性が疑わしい。
 最外郭では20%以下なら良質のデータ、30%程度までなら許容範囲である。 なお、最外郭で20%以下の値なら、さらに高域の分解能までのデータの収集が可能と考えられる。

7. 完全性(Completeness)
 「Completeness vs Resolution」等の「%Comp shell」。通常、累積と最外郭の分解能の値を記載する。
 例1では、累積が98.8%、最外郭(2.09-2.02Å)が100%となる。
 Completenessは、理論上推定される反射と、実際観測された反射との一致度を示す(100%がベスト)。
 累積で90%以上あれば問題ない。一般に80%以上なら十分な精度での解析が可能と言われている。

8. 多重度(“multiplicity” or “redundancy”)
 「Completeness vs Resolution」等の「Ave mult」。
 等価な回折点が幾つ測定されたかを表す。この値が大きいほどデータの信頼性が高い。
 最外郭でも2〜3以上あることが望ましい。

 この「多重度」や「観測された反射数」は、より多くの回折画像を収集する(測定する角度領域を広げる)ことで、値を上げることが できる。ただし、その分、長時間のX線照射を行うことになるため、場合によっては結晶の破損などにより、返ってデータの質を落とすことがある。
 その場合、質の悪い回折画像を省いてScale and Averageを実行するなどの工夫が必要。

9. I/σ(I)
 「Rmerge vs Resolution」の「<<I>/<sig>>」。
 回折強度のS/N比を示す指標。値が大きいほど十分な強度を持つ回折点を測定していると言える。
 最外郭でも1〜2以上が望ましい。

(注) 以上の値は、各種補正 (参照「ここまでの注意点及び改善点4」) を終了した時点での値を判断する。 特に「Rdued ChiSq」の補正は、完全性やI/σ(I)に大きく影響を与える。

改善点

 以上の判断基準を踏まえた上で、今後の構造解析、また再び回折実験を行う際の改善点を簡単に記述する。

1. データの質が悪い
 結論を言えば、より良質な結晶で回折実験をし直すのがベスト。
 しかし、結晶作製に掛かる労力との兼ね合いもあり、その判断は任意としか言えない。 多少、質に不安があっても、構造解析を進めた上で判断する方が無難と思われる。
 モデル構築に不適切な程のものであるなら、そのデータは破棄せざるを得ない。

2. より良質なデータを収集する
 各パラメーターを評価し十分条件を満たしていれば、立体モデルの構築へ進むことに何ら問題は無いが、 より良質なデータを収集できる可能性をデータの質から探ることが出来る。

R-merge vs. カメラ長
 最外郭のR-mergeが、20%以下の値で十分良質なデータと判断できる。得られているデータで20%以下の値をとっている様な場合、 カメラ長を短くして、さらに高角の反射の収集を試みる。
 カメラ長を短くすることで、低角域の反射が重なる可能性があるが、モザイク性が低くければ(0.6以下)特に問題ない。 格子サイズが大きい(100Å以上)場合も、反射の重なりに注意が必要だが、振動角を0.5°以下に設定していれば、ほとんどの場合問題ない。

多重度 vs. 角度領域
 解析に用いられる散乱振幅は等価な回折点の平均であるため、多重度が高ければ高いほどデータの信頼性は高い (より多くの回折点から回折強度を計算していることを示す)。これを改善するには、より広範囲の角度領域を測定する。
 特に対象性が高い空間群の場合、Strategyで推奨される角度領域が狭いため、そのままだと多重度が低くなる可能性は高い。より、広範囲の角度領域(180°以上)で回折像を収集する。

I/σ(I) vs. 露光時間
 I/σ(I)も、値が高いほどその信頼性は高い(より強い強度データを得られていることを示す)が、高角域の回折点は、低角域のそれに比べ、I/σ(I)が低くなるのが普通である。
 それらの領域の回折点をより明確に捉えるため、画像収集時の露光時間を1.5〜2倍程度に上げて測定することなどが考えられる。

 X線照射時間の延長は、結晶の損傷を引き起こす可能性があるが、最終的な回折画像に回折斑点が写っていれば問題ない (逆に言えば、損傷によって回折斑点が写らなくなるまで、画像を収集して良い)。
 また、露光時間を長くすることで、水の回折リング周辺の回折斑点が目視できなくなることもあるが、バックグランドとの差が計算的に確認できれば問題ない。 仮に、その反射が棄却されたとしても、他の画像で等価な点が収集されていれば問題になることは無い。

 いずれにせよ、より多くの回折点を収集することが出来れば、データの信憑性は高くなる。もちろん、全ての回折画像がデータ解析に用いることが出来るとは限らないが、悪質なデータは取り除くことが出来る。



Back