

Using ChatGPT as a SAST tool to find coding errors

生成的AI(Generative AI)は、簡単なプロンプトからのコード生成を含む多くのユースケースを持っています。以前の分析では、GenAIがソフトウェアプロジェクトのソースコードをどのように作成し、分析するかについて説明しました。例えばMicrosoft Copilotなどの製品は、開発者と一緒に座り、開発者が書いている内容に基づいてコード提案を行います。



編集者注: 現代のSASTツールはソースコード分析に加えてバイナリおよびバイトコード分析も提供します。しかし、本記事ではバイナリまたはバイトコード分析については調査しません。


まず、AIが自身のコード内の脆弱性を見つけられるかどうか確認する必要があります。StackHawkから既知の悪質なコード を使用し、AIが問題点を見つけるかどうか見てみましょう。


これは最もシンプルな形式のSQLインジェクションです。この値 の直接挿入は悪用されやすい弱点です。ほとんどのセキュリティ専門家やソフトウェア開発者なら、この弱点を素早く見つけることができます。


ChatGPT が SQL インジェクション 脆弱性 を 見つけた スクリーンショット

ChatGPT は正しく 弱点 を認識し、さらに セキュリティー と エラーハンドリング が改善された 新しい コード を 提供しました。

これは 正しい 結果 ですが 、 提供された コード は 簡単 で 、 答え は よく 知られています 。

Mitre 悪名高い C コード を 使用した 別 の 実例 を 試してみましょう 。

< p > この コード は 少し 複雑 です なぜなら 次 の 三つ の 潜在 的 な 弱点 が 含ま れているからです : バッファオーバーフロー 、 未チェック の 戻り 値 と null ポインター ディレファレンス 。

コード を 提供し 、 Chat GPT に 同じ 質問 を 投げかけます : 「 この コード は 安全 ですか?」

< p > Chat GPT は 正しく 問題 点 を 認識し 、 更新さ れた ソース コード を 提供しました 。しかし 、 Chat GPT が 提供した コード は 本当に 安全なのでしょうか?もう一度 Chat GP T に 聞いてみましょう 。

Chat GPT responded with additional code to update the previously supplied code. By updating its own code, Chat G PT showed that it doesn’t necessarily catch everything on the first pass.

Continually feeding the supplied code back to Chat GP T with the same question leads to more errors found. The third go-around, for example, identified that gethostbyaddr() is considered obsolete. Why didn’t Chat GP T report that in the first place?

More worrying, how many times does the code need questioning before it’s secure? There’s no answer to this question because each developer and organization has a different definition of secure code.

So is Chat GP T a viable S AST tool?

These are some impressive results for a cursory review of using Chat GP T as a S AST tool. ChatGP T identified security vulnerabilities in cod e and provided modified code that eliminated the vulnerabilities.

However, the Ouroboros problem remains: Does continually feeding results as input into the model produce better results? Results vary.ChatGP T has also been known to make up answers when faced with questions that don’t have well-documented answers.

Importantly, security practitioners and developers must validate any errors and results supplied by Chat G PT and check source cod e through a human lens

Using Cha tG PT to do a cursory look at cod e for errors probably yields eighty percent correct result s.The last twenty percent is up to you an d your risk thresholds.It is a good tool to increase efficiency but much more testing is needed for Cha tG PT to replace current S AST tools

Matthe w Smith is virtual CIS O an d management consultant specializing i n cybersecurity risk management an d A I

