9:50 AM - 10:00 AM
[VI-20-06] 大規模血統記録に対する近交係数計算アルゴリズムの違いによる計算時間の比較
【目的】本研究は、大規模血統記録に対する2種類の近交係数計算アルゴリズムの計算時間
を比較することを目的とした。【方法】血統データは、日本ホルスタイン登録協会が収集し
た 1900 年から 2021 年までのホルスタイン種 8,436,990 個体の記録である。個体数と計算
時間の関係を調査するため、生年の古い順に 1,000,000 件ずつ増やしたデータセットを準備
した。使用したプログラムは、再帰関数を使用し、決定論的な方法で近交係数を算出するプ
ログラム(Inb_reg)と、確率的シミュレーション(ジーンドロッピング)に基づいて算出
するプログラム(GRain)の2種類である。Grain のシミュレーション回数は 105回、104回
および 103回とし、計算時間と精度をそれぞれ調査した。計算時間は、プログラム内の計算
開始から計算終了までを Fortran90 の内部組み込み関数によって測定した。【結果】Inb_reg
の計算時間はデータ数が増えるに従い指数関数的に上昇し、GRain は一次関数的に上昇し
た。データ数が 5,400,000 件程度までは Inb_reg の方が速く、それ以上では GRain の方が
速かった。GRain のシミュレーション回数は、105回で十分な精度(R2=0.9996)が得られ、
それに対して 104回以下で精度が低下した
を比較することを目的とした。【方法】血統データは、日本ホルスタイン登録協会が収集し
た 1900 年から 2021 年までのホルスタイン種 8,436,990 個体の記録である。個体数と計算
時間の関係を調査するため、生年の古い順に 1,000,000 件ずつ増やしたデータセットを準備
した。使用したプログラムは、再帰関数を使用し、決定論的な方法で近交係数を算出するプ
ログラム(Inb_reg)と、確率的シミュレーション(ジーンドロッピング)に基づいて算出
するプログラム(GRain)の2種類である。Grain のシミュレーション回数は 105回、104回
および 103回とし、計算時間と精度をそれぞれ調査した。計算時間は、プログラム内の計算
開始から計算終了までを Fortran90 の内部組み込み関数によって測定した。【結果】Inb_reg
の計算時間はデータ数が増えるに従い指数関数的に上昇し、GRain は一次関数的に上昇し
た。データ数が 5,400,000 件程度までは Inb_reg の方が速く、それ以上では GRain の方が
速かった。GRain のシミュレーション回数は、105回で十分な精度(R2=0.9996)が得られ、
それに対して 104回以下で精度が低下した