<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>技術深度 on 都德のブログ</title>
    <link>https://dude.cryomint.com/ja/categories/%E6%8A%80%E8%A1%93%E6%B7%B1%E5%BA%A6/</link>
    <description>Recent content in 技術深度 on 都德のブログ</description>
    <generator>Hugo -- 0.146.0</generator>
    <language>ja</language>
    <lastBuildDate>Sat, 14 Feb 2026 05:45:00 +0800</lastBuildDate>
    <atom:link href="https://dude.cryomint.com/ja/categories/%E6%8A%80%E8%A1%93%E6%B7%B1%E5%BA%A6/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>転写因子結合部位（TFBS）予測技術の進化を深く整理（2023-2026）</title>
      <link>https://dude.cryomint.com/ja/posts/2026-02-14-tfbs-prediction-evolution/</link>
      <pubDate>Sat, 14 Feb 2026 05:45:00 +0800</pubDate>
      <guid>https://dude.cryomint.com/ja/posts/2026-02-14-tfbs-prediction-evolution/</guid>
      <description>&lt;blockquote&gt;
&lt;p&gt;ワンホットエンコーディングから確率的ゲノム表現へ、CNNからKANネットワークへ、TFBS予測はパラダイムシフトの真っ只中にある。&lt;/p&gt;&lt;/blockquote&gt;
&lt;h2 id=&#34;目次&#34;&gt;目次&lt;/h2&gt;
&lt;ol&gt;
&lt;li&gt;&lt;a href=&#34;https://dude.cryomint.com/ja/posts/2026-02-14-tfbs-prediction-evolution/#%e7%89%b9%e5%be%b4%e9%87%8f%e3%82%a8%e3%83%b3%e3%82%b8%e3%83%8b%e3%82%a2%e3%83%aa%e3%83%b3%e3%82%b0%e9%9d%99%e7%9a%84%e8%a1%8c%e5%88%97%e3%81%8b%e3%82%89%e5%8b%95%e7%9a%84%e8%a1%a8%e7%8f%be%e3%81%b8&#34;&gt;特徴量エンジニアリング：静的行列から動的表現へ&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;https://dude.cryomint.com/ja/posts/2026-02-14-tfbs-prediction-evolution/#%e3%83%a2%e3%83%87%e3%83%ab%e3%82%a2%e3%83%bc%e3%82%ad%e3%83%86%e3%82%af%e3%83%81%e3%83%a3%e3%83%a1%e3%82%ab%e3%83%8b%e3%82%ba%e3%83%a0%e7%b5%b1%e5%90%88%e3%81%ae%e6%99%82%e4%bb%a3&#34;&gt;モデルアーキテクチャ：メカニズム統合の時代&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;https://dude.cryomint.com/ja/posts/2026-02-14-tfbs-prediction-evolution/#%e4%b8%bb%e8%a6%81%e6%8a%80%e8%a1%93%e3%81%ae%e6%b7%b1%e5%a0%80%e3%82%8a&#34;&gt;主要技術の深堀り&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;https://dude.cryomint.com/ja/posts/2026-02-14-tfbs-prediction-evolution/#%e6%8a%80%e8%a1%93%e5%b0%8e%e5%85%a5%e5%ae%9f%e8%b7%b5%e3%82%ac%e3%82%a4%e3%83%89&#34;&gt;技術導入実践ガイド&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;https://dude.cryomint.com/ja/posts/2026-02-14-tfbs-prediction-evolution/#%e4%bb%8a%e5%be%8c%e3%81%ae%e3%83%88%e3%83%ac%e3%83%b3%e3%83%89%e5%b1%95%e6%9c%9b&#34;&gt;今後のトレンド展望&lt;/a&gt;&lt;/li&gt;
&lt;/ol&gt;
&lt;hr&gt;
&lt;h2 id=&#34;特徴量エンジニアリング静的行列から動的表現へ&#34;&gt;特徴量エンジニアリング：静的行列から動的表現へ&lt;/h2&gt;
&lt;h3 id=&#34;11-配列表現技術の3世代の進化&#34;&gt;1.1 配列表現技術の3世代の進化&lt;/h3&gt;
&lt;h4 id=&#34;第1世代ワンホットエンコーディング2023年以前&#34;&gt;第1世代：ワンホットエンコーディング（2023年以前）&lt;/h4&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-python&#34; data-lang=&#34;python&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#75715e&#34;&gt;# 従来のワンホットエンコーディングの例&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#66d9ef&#34;&gt;def&lt;/span&gt; &lt;span style=&#34;color:#a6e22e&#34;&gt;one_hot_encode&lt;/span&gt;(sequence):
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    encoding &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; np&lt;span style=&#34;color:#f92672&#34;&gt;.&lt;/span&gt;zeros((&lt;span style=&#34;color:#ae81ff&#34;&gt;4&lt;/span&gt;, len(sequence)))
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;for&lt;/span&gt; i, nucleotide &lt;span style=&#34;color:#f92672&#34;&gt;in&lt;/span&gt; enumerate(sequence):
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#66d9ef&#34;&gt;if&lt;/span&gt; nucleotide &lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#39;A&amp;#39;&lt;/span&gt;:
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;            encoding[&lt;span style=&#34;color:#ae81ff&#34;&gt;0&lt;/span&gt;, i] &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; &lt;span style=&#34;color:#ae81ff&#34;&gt;1&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#66d9ef&#34;&gt;elif&lt;/span&gt; nucleotide &lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#39;C&amp;#39;&lt;/span&gt;:
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;            encoding[&lt;span style=&#34;color:#ae81ff&#34;&gt;1&lt;/span&gt;, i] &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; &lt;span style=&#34;color:#ae81ff&#34;&gt;1&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#66d9ef&#34;&gt;elif&lt;/span&gt; nucleotide &lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#39;G&amp;#39;&lt;/span&gt;:
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;            encoding[&lt;span style=&#34;color:#ae81ff&#34;&gt;2&lt;/span&gt;, i] &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; &lt;span style=&#34;color:#ae81ff&#34;&gt;1&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;        &lt;span style=&#34;color:#66d9ef&#34;&gt;elif&lt;/span&gt; nucleotide &lt;span style=&#34;color:#f92672&#34;&gt;==&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#39;T&amp;#39;&lt;/span&gt;:
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;            encoding[&lt;span style=&#34;color:#ae81ff&#34;&gt;3&lt;/span&gt;, i] &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; &lt;span style=&#34;color:#ae81ff&#34;&gt;1&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;    &lt;span style=&#34;color:#66d9ef&#34;&gt;return&lt;/span&gt; encoding
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;&lt;strong&gt;限界&lt;/strong&gt;: 4×Lの疎行列で、長距離依存を捉えられず、生物学的意味合いが欠如している。&lt;/p&gt;
&lt;h4 id=&#34;第2世代k-mer--transformer埋め込み2023-2024&#34;&gt;第2世代：k-mer + Transformer埋め込み（2023-2024）&lt;/h4&gt;
&lt;p&gt;&lt;strong&gt;代表技術：DNABERT&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;DNA配列を自然言語として扱う&lt;/li&gt;
&lt;li&gt;3-mer/6-merでトークナイズ：&amp;ldquo;ATCGAT&amp;rdquo; → [&amp;ldquo;ATC&amp;rdquo;, &amp;ldquo;TCG&amp;rdquo;, &amp;ldquo;CGA&amp;rdquo;, &amp;ldquo;GAT&amp;rdquo;]&lt;/li&gt;
&lt;li&gt;768次元の連続ベクトル空間にマッピング&lt;/li&gt;
&lt;li&gt;数百bpの複雑な制御パターンを捉えられる&lt;/li&gt;
&lt;/ul&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;pre tabindex=&#34;0&#34; style=&#34;color:#f8f8f2;background-color:#272822;-moz-tab-size:4;-o-tab-size:4;tab-size:4;&#34;&gt;&lt;code class=&#34;language-python&#34; data-lang=&#34;python&#34;&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#75715e&#34;&gt;# DNABERT埋め込み取得の例（簡易版）&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;&lt;span style=&#34;color:#f92672&#34;&gt;from&lt;/span&gt; transformers &lt;span style=&#34;color:#f92672&#34;&gt;import&lt;/span&gt; AutoTokenizer, AutoModel
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;tokenizer &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; AutoTokenizer&lt;span style=&#34;color:#f92672&#34;&gt;.&lt;/span&gt;from_pretrained(&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;zhihan1996/DNABERT-2-117M&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;model &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; AutoModel&lt;span style=&#34;color:#f92672&#34;&gt;.&lt;/span&gt;from_pretrained(&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;zhihan1996/DNABERT-2-117M&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;sequence &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; &lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;ATCGATCGATCGATCGATCGATCGATCGATCG&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;inputs &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; tokenizer(sequence, return_tensors&lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt;&lt;span style=&#34;color:#e6db74&#34;&gt;&amp;#34;pt&amp;#34;&lt;/span&gt;)
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;outputs &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; model(&lt;span style=&#34;color:#f92672&#34;&gt;**&lt;/span&gt;inputs)
&lt;/span&gt;&lt;/span&gt;&lt;span style=&#34;display:flex;&#34;&gt;&lt;span&gt;embedding &lt;span style=&#34;color:#f92672&#34;&gt;=&lt;/span&gt; outputs&lt;span style=&#34;color:#f92672&#34;&gt;.&lt;/span&gt;last_hidden_state  &lt;span style=&#34;color:#75715e&#34;&gt;# Shape: [1, seq_len, 768]&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h4 id=&#34;第3世代バイト対符号化bpe2024-2025&#34;&gt;第3世代：バイト対符号化（BPE）（2024-2025）&lt;/h4&gt;
&lt;p&gt;&lt;strong&gt;代表技術：DNABERT-2&lt;/strong&gt;&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
