คลังของฉัน · 36 ทั้งหมด

ตัวอย่าง

แกลเลอรีของคุณ

ลงชื่อเข้าใช้เพื่อเริ่มสร้าง — ผลงานของคุณจะปรากฏที่นี่

เริ่มสร้างสรรค์

ขับเคลื่อนโดย OPENAI

เครื่องมือสร้างภาพ AI ด้วย GPT Image 2

Q: GPT Image 2 รองรับพื้นหลังแบบโปร่งใสหรือไม่

ไม่รองรับ API มีพารามิเตอร์ background แต่เอกสารของ OpenAI ยืนยันว่า gpt-image-2 ไม่รองรับ background:"transparent" หากเห็นเครื่องมือที่บอกว่าทำได้ นั่นคือการประมวลผลภายหลัง ไม่ใช่ความสามารถดั้งเดิมของโมเดล

OpenAI โมเดลการสร้างและแก้ไขภาพที่โดดเด่นของ OpenAI ไม่ใช่แค่ภาพสวย ๆ — ภาพเชิงพาณิชย์ที่มีโครงสร้างพร้อมข้อความที่ถูกต้อง ขั้นตอนการทำงานที่แก้ไขได้ และ API ควบคุม หากคุณมาจาก DALL·E 3 นี่คือเส้นทางการอัพเกรด

G gpt-image-2 ล็อกแล้ว

ไม่ต้องใช้บัตรเครดิต · เครดิตฟรีเพื่อเริ่มต้น

เอนจิน gpt-image-2 ผู้ให้บริการ OpenAI ค่าใช้จ่าย 2 เครดิต จุดแข็ง ข้อความในภาพ

// คืออะไร PLACARD · N° 01

GPT Image 2 คืออะไร?

GPT Image 2 คือโมเดลสร้างและแก้ไขภาพหลักของ OpenAI เป็นตัวเลือกแรกที่ถูกต้องเมื่อเอาต์พุตต้องการข้อความที่อ่านได้ คำสั่งองค์ประกอบภาพยาว ความแม่นยำระดับสินค้า หรือตัวอักษรหลายภาษาภายในภาพ

บน imagev2.me หน้านี้ล็อกตัวแก้ไขที่ gpt-image-2-text-to-image ดังนั้นทุก prompt จากแถบจะส่งตรงไปยังเวิร์กโฟลว์ GPT Image 2 คุณสามารถตรวจสอบเรนเดอร์สาธารณะ เปรียบเทียบกับเอนจินพี่น้อง แล้วสร้างโดยไม่ต้องพกพารามิเตอร์ผ่าน query string

Generate images in the studio →

// เรนเดอร์ล่าสุด PLACARD · N° 02

ผลงานล่าสุด

เรนเดอร์สาธารณะจริงของ GPT Image 2 จากแกลเลอรี มีประโยชน์สำหรับโครงสร้าง prompt และการคาดหวังเอาต์พุต

GPT Image 2 รีมิกซ์ >

Browse all AI image examples →

// ความสามารถ PLACARD · N° 03

ความสามารถหลักของ GPT Image 2

หกจุดแข็งที่ทำให้ GPT Image 2 เป็นตัวเลือกเริ่มต้นที่ปลอดภัยสำหรับงาน text-to-image เชิงพาณิชย์

ความสามารถ 01

ตัวอักษรที่อ่านได้

ใส่หัวข้อ ป้าย ฉลาก หรือรายการเมนูตรงตัว แล้วเอนจินจะมีโอกาสสูงขึ้นในการเรนเดอร์ตัวอักษรที่ถูกต้อง

ความสามารถ 02

การเชื่อฟัง prompt ยาว

เลย์เอาต์ฉาก ภาษากล้อง แสง และข้อความสามารถอยู่ในย่อหน้าเดียวโดยไม่ถูกละเลยครึ่งหลัง

ความสามารถ 03

เอาต์พุตหลายภาษา

ใช้สำหรับ CJK อาหรับ ฮีบรู ละติน และเลย์เอาต์หลายอักษรเมื่อความชัดเจนของข้อความสำคัญ

ความสามารถ 04

องค์ประกอบเชิงพาณิชย์

โปสเตอร์ ภาพสินค้า ม็อคอัป UI อินโฟกราฟิก และแนวคิดบรรจุภัณฑ์ยังคงมีโครงสร้างแทนที่จะเป็นแค่สวยงาม

ความสามารถ 05

เส้นทางภาพสู่ภาพ

โมเดลแก้ไขพี่น้องช่วยให้คุณนำแนวคิดเดียวกันเข้าสู่เวิร์กโฟลว์ภาพอ้างอิงเมื่อผืนผ้าใบว่างไม่เพียงพอ

ความสามารถ 06

ทิศทางศิลปะที่เป็นกลาง

มันทำตามสไตล์ที่คุณร้องขอแทนที่จะบังคับลุคเฉพาะเจาะจง ทำให้ควบคุมงานลูกค้าได้ง่ายขึ้น

// วิธีใช้ PLACARD · N° 04

วิธีใช้ GPT Image 2 ใน 3 ขั้นตอน

หน้านี้ล็อกที่โมเดลแล้ว; คุณต้องการเพียง prompt และอัตราส่วนภาพ

อธิบายผลลัพธ์

เขียนหัวข้อ รูปแบบ สไตล์ และข้อความที่คุณต้องการ ใส่คำตรงตัวในเครื่องหมายคำพูด

ล็อกเอนจิน

แถบ prompt ส่ง provider_model=gpt-image-2-text-to-image ดังนั้นสตูดิโอจะเปิดที่ GPT Image 2

สร้าง แล้วปรับปรุง

ใช้เรนเดอร์แรกเป็นทิศทาง หากตัวอักษรหรือเลย์เอาต์ต้องการการเปลี่ยนแปลงเฉพาะจุด ให้สลับไปยังขั้นตอนแก้ไข

// กรณีใช้งาน PLACARD · N° 05

6 กรณีใช้งานที่ดีที่สุดของ GPT Image 2

ใช้เมื่อภาพถูกตัดสินจากการปฏิบัติตามคำสั่ง ไม่ใช่แค่บรรยากาศ

โปสเตอร์กิจกรรม

หัวข้อ วันที่ สถานที่ และลำดับชั้นทางภาพสามารถฝังเข้าไปในภาพได้

ม็อคอัปบรรจุภัณฑ์

สร้างแนวคิดสินค้าที่ฉลาก ชื่อรสชาติ และคำเตือนต้องอ่านได้ชัดเจน

ไดอะแกรมเพื่อการศึกษา

สร้างภาพประกอบที่มีป้ายกำกับสำหรับวิทยาศาสตร์ การปฐมนิเทศ และเนื้อหาอธิบาย

แนวคิด UI และแอป

ร่างหน้าจอแอป วิดเจ็ต และฉากแดชบอร์ดพร้อมข้อความอินเทอร์เฟซที่อ่านได้

แบนเนอร์บรรณาธิการ

สร้างภาพหลักที่ผสมผสานทิศทางการถ่ายภาพกับตัวอักษรแบบคำพูดอ้างอิง

แคมเปญหลายภาษา

ทดสอบงานสร้างสรรค์ที่แปลแล้วสำหรับตลาดที่โมเดลภาพเฉพาะละตินล้มเหลว

// vs DALL-E 3 PLACARD · N° 06

GPT Image 2 กับ DALL·E 3

ขั้นตอน DALL-E เดิมนั้นง่าย แต่ GPT Image 2 เป็นตัวเลือกที่ดีกว่าสำหรับการผลิตในด้านข้อความ การแก้ไข และการควบคุมความละเอียด

	GPT Image 2	DALL·E 3
สถานะ	เรือธงในปัจจุบัน	รุ่นก่อนหน้า (วางแผนพระอาทิตย์ตก)
ความละเอียด	ทุกขนาดไม่เกิน 4K	3 ค่าที่ตั้งล่วงหน้าคงที่
แบทช์ (n)	1–10	1 เท่านั้น
การแก้ไข	อ้างอิงภาพ+มาส์ก	รุ่นเท่านั้น
การแสดงผลข้อความ	แข็งแกร่ง (พูดได้หลายภาษา)	ขั้นพื้นฐาน
พารามิเตอร์สไตล์	ไม่มี (ใช้พรอมต์)	สดใส/เป็นธรรมชาติ

บรรทัดล่าง: DALL·E 3 เป็นมรดก สำหรับโครงการใหม่ ให้เริ่มต้นด้วย GPT Image 2 เพื่อความสวยงามอย่างแท้จริง ลอง Midjourney v7 สำหรับงบประมาณจำนวนมาก ลอง FLUX 1.1 Pro สำหรับการออกแบบตัวอักษรของแบรนด์ ให้เปรียบเทียบกับ Ideogram 3

// vs Nano Banana PLACARD · N° 07

GPT Image 2 vs Nano Banana

Nano Banana เร็วกว่าและถูกกว่าสำหรับแบบร่าง; GPT Image 2 ชนะเมื่อข้อความหรือคำสั่งที่หนาแน่นสำคัญ

คุณสมบัติ	GPT Image 2	Nano Banana
การใช้งานแรกที่ดีที่สุด	ภาพที่มีข้อความมากหรือมีโครงสร้าง	แบบร่างภาพถ่ายสมจริงเร็ว
ค่าใช้จ่ายเฉลี่ย	2 เครดิต	1 เครดิต
ความละเอียด	สูงสุด 2048px ในเส้นทางนี้	เอาต์พุตเร็ว 1024px
ตัวอักษร	แข็งแกร่ง	พื้นฐาน
สไตล์การทำซ้ำ	การปรับแต่ง prompt ที่แม่นยำ	รูปแบบมู้ดบอร์ดที่รวดเร็ว

Try Nano Banana on imagev2.me →

// vs Midjourney PLACARD · N° 08

GPT Image 2 vs Midjourney

Midjourney มีลายเซ็นสุนทรียศาสตร์ที่แข็งแกร่ง GPT Image 2 ดีกว่าเมื่อบรีฟเฉพาะเจาะจงและเชิงพาณิชย์

คุณสมบัติ	GPT Image 2	Midjourney
รูปแบบการเข้าถึง	สตูดิโอบนเบราว์เซอร์พร้อมเครดิตฟรี	ต้องสมัครสมาชิกก่อน
สไตล์ภาพ	ทำตามทิศทางที่ร้องขอ	สไตล์จิตรกรรมเฉพาะตัวที่โดดเด่น
ข้อความในภาพ	จุดแข็งหลัก	ไม่ใช่จุดแข็งหลัก
บรีฟลูกค้า	ดีสำหรับข้อความและเลย์เอาต์ที่แม่นยำ	ดีสำหรับอารมณ์และสุนทรียศาสตร์
เวิร์กโฟลว์	Prompt สร้าง แก้ไขในสตูดิโอเดียว	ขั้นตอนเว็บ/ชุมชนแยกกัน

Try Nano Banana 2 for the newest reasoning engine →

// คู่มือการตัดสินใจ PLACARD · N° 09

คุณควรใช้ GPT Image 2 หรือไม่

ดีที่สุดสำหรับ

โปสเตอร์ที่มีข้อความหนาแน่น
การจำลอง UI
ช็อตสินค้า
อินโฟกราฟิก
การแก้ไขภาพต่อภาพ
ภาพอ้างอิงสูงสุด 16 ภาพ

ไม่เหมาะสำหรับ

รูปแบบพิกเซลที่สมบูรณ์แบบ
ความสม่ำเสมอของตัวละครหลายรอบ
API พื้นหลังโปร่งใส
ภาพฮีโร่ที่สวยงามอย่างแท้จริง

พิจารณาแทน

Midjourney v7 — สุนทรียภาพ
FLUX 1.1 Pro — ถูกและรวดเร็ว
Ideogram 3 — การพิมพ์/โลโก้
DALL·E 3 — มรดกเท่านั้น

Try Nano Banana Pro for 4K renders →

// พารามิเตอร์และราคา PLACARD · N° 10

พารามิเตอร์ที่สำคัญและราคา

ความละเอียด	สูงถึง 3840px ขอบ 16px ทวีคูณ อัตราส่วนสูงสุด 3:1 ทั่วไป: 1024², 2048², 4K
คุณภาพ	ต่ำ (ร่าง) · ปานกลาง · สูง · อัตโนมัติ>2560×1440 = ทดลอง
เอาท์พุต	PNG (ค่าเริ่มต้น), JPEG (เร็วกว่า), WebP การบีบอัด 0-100 น=1-10.
ไม่มีพารามิเตอร์สไตล์	สดใส/เป็นธรรมชาติคือ DALL·E 3 เท่านั้น การควบคุมสไตล์ผ่านพร้อมท์ + รูปภาพอ้างอิง

คุณภาพ	OpenAI API	imagev2.me
ต่ำ (ร่าง)	~$0.006	6 เครดิต
ปานกลาง	~$0.053	6 เครดิต
สูง	~$0.211	6 เครดิต

อัตราโทเค็นอย่างเป็นทางการ: การป้อนข้อความ $5/M, การป้อนรูปภาพ $8/M, เอาต์พุตรูปภาพ $30/M ชุด API = ลด 50%

// การเข้าถึง api PLACARD · N° 11

การเข้าถึง API ของ GPT Image 2

สตูดิโอเว็บและ API ใช้ id โมเดลเดียวกัน ระบุ provider_model อย่างชัดเจนเพื่อให้งานสามารถทำซ้ำได้

GenerationsService.submit(
  account: current_account,
  params: {
    provider_model: "gpt-image-2-text-to-image",
    mode: "text_to_image",
    prompt: "A poster reading \"OPEN LATE\" in red neon",
    aspect_ratio: "1:1",
    resolution: "2048x2048"
  }
)

// ริบบิ้นผู้สร้าง PLACARD · N° 12

ริบบิ้นผู้สร้าง: prompt ล่าสุดของ GPT Image 2

GPT Image 2 รีมิกซ์ >

// ตัวเลข PLACARD · N° 13

GPT Image 2 ในตัวเลข

2 เครดิตต่อเรนเดอร์มาตรฐาน

2048 px เป้าหมาย HD

16 ภาพอ้างอิงในขั้นตอนแก้ไข

1 เอนจินที่ล็อกบนหน้านี้

// faq PLACARD · N° 14

คำถามที่พบบ่อย

Q01 GPT Image 2 รองรับความละเอียดอะไรบ้าง

ขนาดใดก็ได้ที่ขอบสูงสุด ≤3840px แต่ละด้านจะเป็นผลคูณของ 16px อัตราส่วนภาพ ≤3:1 และพิกเซลทั้งหมดระหว่าง 655K–8.3M ค่าที่ตั้งล่วงหน้าทั่วไป: 1024×1024, 1536×1024, 2048×2048, 3840×2160 ความละเอียดที่สูงกว่า 2560×1440 เป็นเพียงการทดลอง

Q02 GPT Image 2 รองรับพื้นหลังแบบโปร่งใสหรือไม่

ไม่รองรับ API มีพารามิเตอร์ background แต่เอกสารของ OpenAI ยืนยันว่า gpt-image-2 ไม่รองรับ background:"transparent" หากเห็นเครื่องมือที่บอกว่าทำได้ นั่นคือการประมวลผลภายหลัง ไม่ใช่ความสามารถดั้งเดิมของโมเดล

Q03 สามารถแสดงข้อความภาษาจีน / ไม่ใช่ภาษาละตินได้อย่างถูกต้องหรือไม่

GPT Image 2 ปรับปรุงข้อความที่มีความหนาแน่นและการเรนเดอร์หลายภาษาอย่างมีนัยสำคัญ ความคิดเห็นของชุมชนเกี่ยวกับภาษาจีน/ญี่ปุ่น/เกาหลีนั้นเป็นไปในเชิงบวก อย่างไรก็ตาม OpenAI ยังไม่ได้เผยแพร่การวัดประสิทธิภาพความแม่นยำของแต่ละภาษา ดังนั้นอาจมีข้อผิดพลาดเป็นครั้งคราวในองค์ประกอบ CJK ที่ซับซ้อน

Q04 เหตุใดรูปภาพของฉันจึงดูแตกต่างไปหลังจากการแก้ไขครั้งที่ 3

การเบี่ยงเบนของลักษณะและสไตล์ระหว่างการแก้ไขซ้ำๆ เป็นข้อจำกัดที่ทราบซึ่งระบุไว้ใน OpenAI โมเดลนี้ดีกว่า DALL·E 3 มาก แต่ยังไม่มีเสถียรภาพ "การผลิตสินทรัพย์แบรนด์" เคล็ดลับ: ปักหมุดองค์ประกอบที่สำคัญในข้อความแจ้งของคุณ ("คงใบหน้า ท่าทาง และเสื้อผ้าไว้ไม่เปลี่ยนแปลง")

Q05 หนึ่งภาพราคาเท่าไหร่?

OpenAI API ที่ 1024×1024: ~$0.006 (ต่ำ), ~$0.053 (กลาง), ~$0.211 (สูง) บน imagev2.me: ใช้ 6 เครดิตสำหรับข้อความเป็นรูปภาพ และ 8 เครดิตสำหรับรูปภาพเป็นรูปภาพ เริ่มฟรี ไม่ต้องใช้บัตรเครดิต

Browse all AI image generation topics →

// ลองด้วย PLACARD · N° 15

ลองเอนจินอื่นด้วย

สลับเมื่องานต้องการความเร็ว ความขัดเกลา 4K หรือโมเดลการให้เหตุผลล่าสุดจากตระกูล Banana

B Nano Banana แบบร่างเร็ว

ใช้ Nano Banana เมื่อคุณต้องการรูปแบบภาพถ่ายสมจริงที่รวดเร็วและค่าเครดิตต่ำ

P Nano Banana Pro ขัดเกลา 4K

ใช้ Nano Banana Pro สำหรับภาพบุคคลความเที่ยงตรงสูง ภาพถ่ายสินค้า และเอาต์พุต 4K

2 Nano Banana 2 Banana ใหม่ล่าสุด

ใช้ Nano Banana 2 สำหรับโมเดลการให้เหตุผลล่าสุดและเวิร์กโฟลว์อ้างอิงที่กว้างขึ้น

พร้อมที่จะลอง GPT Image 2 แล้วหรือยัง?

พิมพ์ข้อความแจ้งของคุณในแผงด้านซ้าย ไม่จำเป็นต้องตั้งค่า

Model specifications sourced from official documentation: OpenAI API reference and Google AI model cards. Learn more about imagev2.me.